彩摘网>新事>正文

SQL Server数据库中表和索引结构存储的原理及如何加快搜索速度分析

2019-02-24 09:36:00 IT时代网 [ 数据库 ] 分享

  本文详细分析了SQL Server中表和索引结构存储的原理以及对于如何加快速度和提高效率等方面做了详细的分析,以下是主要内容。

  下图显示了表的存储组织,每张表有一个对应的对象ID,并且包含一个或多个分区,每个分区会有一个堆或者多个B树,堆或者B树的结构是预留的。每个堆或者是B树都有三个分配单元用来存放数据,分别是数据、LOB、行溢出,使用最多的分配单元是数据。如果有LOB数据或者是长度超过8000字节的记录,则可能有另外的LOB分配单元和行溢出分配单元。

  小总结: 一个表可以有多个分区,但是每个分区(堆/B树)最多有三个分配单元,每个分配单元可以有很多页,对于每个分配单元内的数据页,根据表是否有索引,以及索引是聚集还是非聚集,组织方式有以下三种:

1. 堆

  所谓堆(heap),就是不含聚集索引的表。堆的 sys.partitions 中具有一行,对于堆使用的每个分区,都有index_id= 0。只有一个分区,在系统表里,对于这个分区下面的每个分配单元都有一个连接指向Index Allocation Map页(IAM),在IAM页里,描述了区的信息。

  sys.system_internals_allocation_units系统视图中的列first_iam_page指向管理特定分区中堆的分配空间的一系列 IAM 页的第一页。SQL Server 使用 IAM 页在堆中移动。堆内的数据页和行没有任何特定的顺序,也不链接在一起。数据页之间唯一的逻辑连接是记录在 IAM 页内的信息。

2. 具有非聚集索引的表

  如果有一个表只有非聚集索引而没有聚集索引,对应的索引号是2--250。那么针对每个非聚集索引,都有一个对应的分区,在系统表进而,对于这个分区下面的每个分配单元,都有一个连接指向根页。数据页之间通过前后指针互相联系,是一个完整的树形结构。在树的底层,会有一个连接指向真正的数据,连接的形式是文件号+页号+行号,而真正的数据是以堆的形式存放的。如下图所示:

3. 具有聚集索引的表

  表中的聚集索引,对应的索引号是1。它有一个对应的分区,该分区下的每个分配单元都有一个连接指向根页。对于聚集索引来说,叶子结点里存放的是真正的数据,而不是非聚集索引那样的连接。如下图所示:

  非聚集索引与聚集索引具有相同的 B 树结构,它们之间的显著差别在于以下两点:

声明:本站部分资源来源于网络,版权归原作者或者来源机构所有,如作者或来源机构不同意本站转载采用,请通知我们,我们将第一时间删除内容。本站刊载文章出于传递更多信息之目的,所刊文章观点仅代表作者本人观点,并不意味着本站赞同作者观点或证实其描述,其原创性及对文章内容的真实性、完整性、及时性本站亦不作任何保证或承诺,请读者仅作参考。
编辑: