精华内容
下载资源
问答
  • 索引与非聚索引区别以及SQL Server查询优化技术 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正式因为...
    
    

    在《数据库原理》里面,对聚簇索引的解释是:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚簇索引。

    不过这个定义太抽象了。在SQL Server中,索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。如下图:


    非聚簇索引

     


    聚簇索引


    聚簇索引与非聚簇索引的本质区别到底是什么?什么时候用聚簇索引,什么时候用非聚簇索引?

    这是一个很复杂的问题,很难用三言两语说清楚。我在这里从SQL Server索引优化查询的角度简单谈谈(如果对这方面感兴趣的话,可以读一读微软出版的《Microsoft SQL Server 2000数据库编程》第3单元的数据结构引论以及第6、13、14单元)。


    一、索引块与数据块的区别

    大家都知道,索引可以提高检索效率,因为它的二叉树结构以及占用空间小,所以访问速度块。让我们来算一道数学题:如果表中的一条记录在磁盘上占用1000字节的话,我们对其中10字节的一个字段建立索引,那么该记录对应的索引块的大小只有10字节。我们知道,SQL Server的最小空间分配单元是“页(Page)”,一个页在磁盘上占用8K空间,那么这一个页可以存储上述记录8条,但可以存储索引800条。现在我们要从一个有8000条记录的表中检索符合某个条件的记录,如果没有索引的话,我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话,那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块,然后根据索引块上的指针逐一找到结果数据块,这样IO访问量要少的多。


    二、索引优化技术

    是不是有索引就一定检索的快呢?答案是否。有些时候用索引还不如不用索引快。比如说我们要检索上述表中的所有记录,如果不用索引,需要访问8000条×1000字节/8K字节=1000个页面,如果使用索引的话,首先检索索引,访问8000条×10字节/8K字节=10个页面得到索引检索结果,再根据索引检索结果去对应数据页面,由于是检索所有数据,所以需要再访问8000条×1000字节/8K字节=1000个页面将全部数据读取出来,一共访问了1010个页面,这显然不如不用索引快。

    SQL Server内部有一套完整的数据检索优化技术,在上述情况下,SQL Server的查询计划(Search Plan)会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQL Server是怎么知道什么时候用索引,什么时候不用索引的呢?SQL Server除了日常维护数据信息外,还维护着数据统计信息,下图是数据库属性页面的一个截图:

    从图中我们可以看到,SQL Server自动维护统计信息,这些统计信息包括数据密度信息以及数据分布信息,这些信息帮助SQL Server决定如何制定查询计划以及查询是是否使用索引以及使用什么样的索引(这里就不再解释它们到底如何帮助SQL Server建立查询计划的了)。我们还是来做个实验。建立一张表:tabTest(ID, unqValue,intValue),其中ID是整形自动编号主索引,unqValue是uniqueidentifier类型,在上面建立普通索引,intValue 是整形,不建立索引。之所以挂上一个没有索引的intValue字段,就是防止SQL Server使用索引覆盖查询优化技术,这样实验就起不到作用了。向表中录入10000条随机记录,代码如下:

    CREATE TABLE [dbo].[tabTest] (
     
    [ID] [int] IDENTITY (11NOT NULL ,
     
    [unqValue] [uniqueidentifier] NOT NULL ,
     
    [intValue] [int] NOT NULL 
    ON [PRIMARY]
    GO

    ALTER TABLE [dbo].[tabTest] WITH NOCHECK ADD 
     
    CONSTRAINT [PK_tabTest] PRIMARY KEY  CLUSTERED 
     (
      
    [ID]
     )  
    ON [PRIMARY] 
    GO

    ALTER TABLE [dbo].[tabTest] ADD 
     
    CONSTRAINT [DF_tabTest_unqValue] DEFAULT (newid()) FOR [unqValue]
    GO

    CREATE  INDEX [IX_tabTest_unqValue] ON [dbo].[tabTest]([unqValue]ON [PRIMARY]
    GO

    declare @i int
    declare @v int

    set @i=0
    while @i<10000
    begin
        
    set @v=rand()*1000    
        
    insert into tabTest ([intValue]values (@v)
        
    set @i=@i+1
    end

    然后我们执行两个查询并查看执行计划,如图:(在查询分析器的查询菜单中可以打开查询计划,同时图上第一个查询的GUID是我从数据库中找的,大家做实验的时候可以根据自己数据库中的值来定):



    从图中可以看出,在第一个查询中,SQL Server使用了IX_tabTest_unqValue索引,根据箭头方向,计算机先在索引范围内找,找到后,使用Bookmark Lookup将索引节点映射到数据节点上,最后给出SELECT结果。在第二个查询中,系统直接遍历表给出结果,不过它使用了聚簇索引,为什么呢?不要忘了,聚簇索引的页节点就是数据节点!这样使用聚簇索引会更快一些(不受数据删除、更新留下的存储空洞的影响,直接遍历数据是要跳过这些空洞的)。

    下面,我们在SQL Server中将ID字段的聚簇索引更改为非聚簇索引,然后再执行select * from tabTest,这回我们看到的执行计划变成了:

    SQL Server没有使用任何索引,而是直接执行了Table Scan,因为只有这样,检索效率才是最高的。


    三、聚簇索引与非聚簇索引的本质区别

    现在可以讨论聚簇索引与非聚簇索引的本质区别了。正如本文最前面的两个图所示,聚簇索引的叶节点就是数据节点,而非聚簇索引的页节点仍然是索引检点,并保留一个链接指向对应数据块。

    还是通过一道数学题来看看它们的区别吧:假设有一8000条记录的表,表中每条记录在磁盘上占用1000字节,如果在一个10字节长的字段上建立非聚簇索引主键,需要二叉树节点16000个(这16000个节点中有8000个叶节点,每个页节点都指向一个数据记录),这样数据将占用8000条×1000字节/8K字节=1000个页面;索引将占用16000个节点×10字节/8K字节=20个页面,共计1020个页面。

    同样一张表,如果我们在对应字段上建立聚簇索引主键,由于聚簇索引的页节点就是数据节点,所以索引节点仅有8000个,占用10个页面,数据仍然占有1000个页面。

    下面我们看看在执行插入操作时,非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复,那么SQL Server是怎么知道不出现重复的呢?唯一的方法就是检索。对于非聚簇索引,只需要检索20个页面中的16000个节点就知道是否有重复,因为所有主键键值在这16000个索引节点中都包含了。但对于聚簇索引,索引节点仅仅包含了8000个中间节点,至于会不会出现重复必须检索另外1000个页数据节点才知道,那么相当于检索10+1000=1010个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

    让我们再来看看数据检索的效率,如果对上述两表进行检索,在使用索引的情况下(有些时候SQL Server执行计划会选择不使用索引,不过我们这里姑且假设一定使用索引),对于聚簇索引检索,我们可能会访问10个索引页面外加1000个数据页面得到结果(实际情况要比这个好),而对于非聚簇索引,系统会从20个页面中找到符合条件的节点,再映射到1000个数据页面上(这也是最糟糕的情况),比较一下,一个访问了1010个页面而另一个访问了1020个页面,可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好,都适合排序,聚簇索引仅仅比非聚簇索引快一点。


    结语

    好了,写了半天,手都累了。关于聚簇索引与非聚簇索引效率问题的实验就不做了,感兴趣的话可以自己使用查询分析器对查询计划进行分析。SQL Server是一个很复杂的系统,尤其是索引以及查询优化技术,Oracle就更复杂了。了解索引以及查询背后的事情不是什么坏事,它可以帮助我们更为深刻的了解我们的系统。

    展开全文
  • 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正 式因为如此,所以一个表最多只能有一个聚索引。 不过...

    在《数据库原理》里面,对聚簇索引的解释是:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的解释是:索引顺序与数据物理排列顺序无关。正 式因为如此,所以一个表最多只能有一个聚簇索引。

    不过这个定义太抽象了。在SQL Server中,索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不 过有一个指针指向对应的数据块。如下图:


    非聚簇索引

     


    聚簇索引


    聚 簇索引与非聚簇索引的本质区别到底是什么?什么时候用聚簇索引,什么时候用非聚簇索引?

    这是一个很复杂的问题,很难用三言两语说清楚。我在 这里从SQL Server索引优化查询的角度简单谈谈(如果对这方面感兴趣的话,可以读一读微软出版的《Microsoft SQL Server 2000数据库编程》第3单元的数据结构引论以及第6、13、14单元)。


    一、索 引块与数据块的区别

    大家都知道,索引可以提高检索效率,因为它的二叉树结构以及占用空间小,所以访问速度 块。让我们来算一道数学题:如果表中的一条记录在磁盘上占用1000字节的话,我们对其中10字节的一个字段建立索引,那么该记录对应的索引块的大小只有 10字节。我们知道,SQL Server的最小空间分配单元是“页(Page)”,一个页在磁盘上占用8K空间,那么这一个页可以存储上述记录8条,但可以存储索引800条。现在我 们要从一个有8000条记录的表中检索符合某个条件的记录,如果没有索引的话,我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能 够找到结果。如果在检索字段上有上述索引的话,那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块,然后根据索引块上 的指针逐一找到结果数据块,这样IO访问量要少的多。


    二、索引优化技术

    是 不是有索引就一定检索的快呢?答案是否。有些时候用索引还不如不用索引快。比如说我们要检索上述表中的所有记录,如果不用索引,需要访问8000条 ×1000字节/8K字节=1000个页面,如果使用索引的话,首先检索索引,访问8000条×10字节/8K字节=10个页面得到索引检索结果,再根据 索引检索结果去对应数据页面,由于是检索所有数据,所以需要再访问8000条×1000字节/8K字节=1000个页面将全部数据读取出来,一共访问了 1010个页面,这显然不如不用索引快。

    SQL Server内部有一套完整的数据检索优化技术,在上述情况下,SQL Server的查询计划(Search Plan)会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQL Server是怎么知道什么时候用索引,什么时候不用索引的呢?SQL Server除了日常维护数据信息外,还维护着数据统计信息,下图是数据库属性页面的一个截图:

    从图中我们可以看到,SQL Server自动维护统计信息,这些统计信息包括数据密度信息以及数据分布信息,这些信息帮助SQL Server决定如何制定查询计划以及查询是是否使用索引以及使用什么样的索引(这里就不再解释它们到底如何帮助SQL Server建立查询计划的了)。我们还是来做个实验。建立一张表:tabTest(ID , unqValue,intValue),其中ID是整形自动编号主索引,unqValue是uniqueidentifier类型,在上面建立普通索 引,intValue 是整形,不建立索引。之所以挂上一个没有索引的intValue字段,就是防止SQL Server使用索引覆盖查询优化技术,这样实验就起不到作用了。向表中录入10000条随机记录,代码如下:

    CREATE   TABLE   [ dbo ] . [ tabTest ]  (
     
    [ ID ]   [ int ]   IDENTITY  ( 1 1 NOT   NULL  ,
     
    [ unqValue ]   [ uniqueidentifier ]   NOT   NULL  ,
     
    [ intValue ]   [ int ]   NOT   NULL  
    ON   [ PRIMARY ]
    GO

    ALTER   TABLE   [ dbo ] . [ tabTest ]   WITH   NOCHECK   ADD  
     
    CONSTRAINT   [ PK_tabTest ]   PRIMARY   KEY    CLUSTERED  
     (
      
    [ ID ]
     )  
    ON   [ PRIMARY ]  
    GO

    ALTER   TABLE   [ dbo ] . [ tabTest ]   ADD  
     
    CONSTRAINT   [ DF_tabTest_unqValue ]   DEFAULT  ( newid ())  FOR   [ unqValue ]
    GO

    CREATE    INDEX   [ IX_tabTest_unqValue ]   ON   [ dbo ] . [ tabTest ] ( [ unqValue ] ON   [ PRIMARY ]
    GO

    declare  @i  int
    declare  @v  int

    set  @i = 0
    while  @i < 10000
    begin
        
    set  @v = rand () * 1000     
        
    insert   into  tabTest ( [ intValue ] values  (@v)
        
    set  @i = @i + 1
    end

    然后我们执行两个查询并查看执行计划,如图:(在查询分析器的查询菜单中可以打开 查询计划,同时图上第一个查询的GUID是我从数据库中找的,大家做实验的时候可以根据自己数据库中的值来定):



    从图中可以看出,在第一个查询中,SQL Server使用了IX_tabTest_unqValue索引,根据箭头方向,计算机先在索引范围内找,找到后,使用Bookmark Lookup将索引节点映射到数据节点上,最后给出SELECT结果。在第二个查询中,系统直接遍历表给出结果,不过它使用了聚簇索引,为什么呢?不要忘 了,聚簇索引的页节点就是数据节点!这样使用聚簇索引会更快一些(不受数据删除、更新留下的存储空洞的影响,直接遍历数据是要跳过这些空洞的)。

    下 面,我们在SQL Server中将ID字段的聚簇索引更改为非聚簇索引,然后再执行select * from tabTest,这回我们看到的执行计划变成了:

    SQL Server没有使用任何索引,而是直接执行了Table Scan,因为只有这样,检索效率才是最高的。


    三、 聚簇索引与非聚簇索引的本质区别

    现在可以讨论聚簇索引与非聚簇索引的本质区别了。正如本文最前面的两个图 所示,聚簇索引的叶节点就是数据节点,而非聚簇索引的页节点仍然是索引检点,并保留一个链接指向对应数据块。

    还是通过一道数学题来看看它们 的区别吧:假设有一8000条记录的表,表中每条记录在磁盘上占用1000字节,如果在一个10字节长的字段上建立非聚簇索引主键,需要二叉树节点 16000个(这16000个节点中有8000个叶节点,每个页节点都指向一个数据记录),这样数据将占用8000条×1000字节/8K字节=1000 个页面;索引将占用16000个节点×10字节/8K字节=20个页面,共计1020个页面。

    同样一张表,如果我们在对应字段上建立聚簇索 引主键,由于聚簇索引的页节点就是数据节点,所以索引节点仅有8000个,占用10个页面,数据仍然占有1000个页面。

    下面我们看看在执 行插入操作时,非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复,那么SQL Server是怎么知道不出现重复的呢?唯一的方法就是检索。对于非聚簇索引,只需要检索20个页面中的16000个节点就知道是否有重复,因为所有主键 键值在这16000个索引节点中都包含了。但对于聚簇索引,索引节点仅仅包含了8000个中间节点,至于会不会出现重复必须检索另外1000个页数据节点 才知道,那么相当于检索10+1000=1010个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

    让 我们再来看看数据检索的效率,如果对上述两表进行检索,在使用索引的情况下(有些时候SQL Server执行计划会选择不使用索引,不过我们这里姑且假设一定使用索引),对于聚簇索引检索,我们可能会访问10个索引页面外加1000个数据页面得 到结果(实际情况要比这个好),而对于非聚簇索引,系统会从20个页面中找到符合条件的节点,再映射到1000个数据页面上(这也是最糟糕的情况),比较 一下,一个访问了1010个页面而另一个访问了1020个页面,可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好,都适合排序,聚簇 索引仅仅比非聚簇索引快一点。

    展开全文
  • 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚索引。 不过这个定义太...

    在《数据库原理》里面,对聚簇索引的解释是:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚簇索引。

    不过这个定义太抽象了。在SQL Server中,索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。如下图:


    非聚簇索引

     


    聚簇索引


    聚簇索引与非聚簇索引的本质区别到底是什么?什么时候用聚簇索引,什么时候用非聚簇索引?

    这是一个很复杂的问题,很难用三言两语说清楚。我在这里从SQL Server索引优化查询的角度简单谈谈(如果对这方面感兴趣的话,可以读一读微软出版的《Microsoft SQL Server 2000数据库编程》第3单元的数据结构引论以及第6、13、14单元)。


    一、索引块与数据块的区别

    大家都知道,索引可以提高检索效率,因为它的二叉树结构以及占用空间小,所以访问速度块。让我们来算一道数学题:如果表中的一条记录在磁盘上占用1000字节的话,我们对其中10字节的一个字段建立索引,那么该记录对应的索引块的大小只有10字节。我们知道,SQL Server的最小空间分配单元是“页(Page)”,一个页在磁盘上占用8K空间,那么这一个页可以存储上述记录8条,但可以存储索引800条。现在我们要从一个有8000条记录的表中检索符合某个条件的记录,如果没有索引的话,我们可能需要遍历8000条×1000字节/8K字节=1000个页面才能够找到结果。如果在检索字段上有上述索引的话,那么我们可以在8000条×10字节/8K字节=10个页面中就检索到满足条件的索引块,然后根据索引块上的指针逐一找到结果数据块,这样IO访问量要少的多。


    二、索引优化技术

    是不是有索引就一定检索的快呢?答案是否。有些时候用索引还不如不用索引快。比如说我们要检索上述表中的所有记录,如果不用索引,需要访问8000条×1000字节/8K字节=1000个页面,如果使用索引的话,首先检索索引,访问8000条×10字节/8K字节=10个页面得到索引检索结果,再根据索引检索结果去对应数据页面,由于是检索所有数据,所以需要再访问8000条×1000字节/8K字节=1000个页面将全部数据读取出来,一共访问了1010个页面,这显然不如不用索引快。

    SQL Server内部有一套完整的数据检索优化技术,在上述情况下,SQL Server的查询计划(Search Plan)会自动使用表扫描的方式检索数据而不会使用任何索引。那么SQL Server是怎么知道什么时候用索引,什么时候不用索引的呢?SQL Server除了日常维护数据信息外,还维护着数据统计信息,下图是数据库属性页面的一个截图:

    从图中我们可以看到,SQL Server自动维护统计信息,这些统计信息包括数据密度信息以及数据分布信息,这些信息帮助SQL Server决定如何制定查询计划以及查询是是否使用索引以及使用什么样的索引(这里就不再解释它们到底如何帮助SQL Server建立查询计划的了)。我们还是来做个实验。建立一张表:tabTest(ID, unqValue,intValue),其中ID是整形自动编号主索引,unqValue是uniqueidentifier类型,在上面建立普通索引,intValue 是整形,不建立索引。之所以挂上一个没有索引的intValue字段,就是防止SQL Server使用索引覆盖查询优化技术,这样实验就起不到作用了。向表中录入10000条随机记录,代码如下:

     

    ContractedBlock.gifExpandedBlockStart.gifCode
    CREATE TABLE [dbo].[tabTest] (
     
    [ID] [int] IDENTITY (11NOT NULL ,
     
    [unqValue] [uniqueidentifier] NOT NULL ,
     
    [intValue] [int] NOT NULL 
    ON [PRIMARY]
    GO

    ALTER TABLE [dbo].[tabTest] WITH NOCHECK ADD 
     
    CONSTRAINT [PK_tabTest] PRIMARY KEY  CLUSTERED 
     (
      
    [ID]
     )  
    ON [PRIMARY] 
    GO

    ALTER TABLE [dbo].[tabTest] ADD 
     
    CONSTRAINT [DF_tabTest_unqValue] DEFAULT (newid()) FOR [unqValue]
    GO

    CREATE  INDEX [IX_tabTest_unqValue] ON [dbo].[tabTest]([unqValue]ON [PRIMARY]
    GO

    declare @i int
    declare @v int

    set @i=0
    while @i<10000
    begin
        
    set @v=rand()*1000    
        
    insert into tabTest ([intValue]values (@v)
        
    set @i=@i+1
    end

     

    然后我们执行两个查询并查看执行计划,如图:(在查询分析器的查询菜单中可以打开查询计划,同时图上第一个查询的GUID是我从数据库中找的,大家做实验的时候可以根据自己数据库中的值来定):



    从图中可以看出,在第一个查询中,SQL Server使用了IX_tabTest_unqValue索引,根据箭头方向,计算机先在索引范围内找,找到后,使用Bookmark Lookup将索引节点映射到数据节点上,最后给出SELECT结果。在第二个查询中,系统直接遍历表给出结果,不过它使用了聚簇索引,为什么呢?不要忘了,聚簇索引的页节点就是数据节点!这样使用聚簇索引会更快一些(不受数据删除、更新留下的存储空洞的影响,直接遍历数据是要跳过这些空洞的)。

    下面,我们在SQL Server中将ID字段的聚簇索引更改为非聚簇索引,然后再执行select * from tabTest,这回我们看到的执行计划变成了:

    SQL Server没有使用任何索引,而是直接执行了Table Scan,因为只有这样,检索效率才是最高的。


    三、聚簇索引与非聚簇索引的本质区别

    现在可以讨论聚簇索引与非聚簇索引的本质区别了。正如本文最前面的两个图所示,聚簇索引的叶节点就是数据节点,而非聚簇索引的页节点仍然是索引检点,并保留一个链接指向对应数据块。

    还是通过一道数学题来看看它们的区别吧:假设有一8000条记录的表,表中每条记录在磁盘上占用1000字节,如果在一个10字节长的字段上建立非聚簇索引主键,需要二叉树节点16000个(这16000个节点中有8000个叶节点,每个页节点都指向一个数据记录),这样数据将占用8000条×1000字节/8K字节=1000个页面;索引将占用16000个节点×10字节/8K字节=20个页面,共计1020个页面。

    同样一张表,如果我们在对应字段上建立聚簇索引主键,由于聚簇索引的页节点就是数据节点,所以索引节点仅有8000个,占用10个页面,数据仍然占有1000个页面。

    下面我们看看在执行插入操作时,非聚簇索引的主键为什么比聚簇索引主键要快。主键约束要求主键不能出现重复,那么SQL Server是怎么知道不出现重复的呢?唯一的方法就是检索。对于非聚簇索引,只需要检索20个页面中的16000个节点就知道是否有重复,因为所有主键键值在这16000个索引节点中都包含了。但对于聚簇索引,索引节点仅仅包含了8000个中间节点,至于会不会出现重复必须检索另外1000个页数据节点才知道,那么相当于检索10+1000=1010个页面才知道是否有重复。所以聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

    让我们再来看看数据检索的效率,如果对上述两表进行检索,在使用索引的情况下(有些时候SQL Server执行计划会选择不使用索引,不过我们这里姑且假设一定使用索引),对于聚簇索引检索,我们可能会访问10个索引页面外加1000个数据页面得到结果(实际情况要比这个好),而对于非聚簇索引,系统会从20个页面中找到符合条件的节点,再映射到1000个数据页面上(这也是最糟糕的情况),比较一下,一个访问了1010个页面而另一个访问了1020个页面,可见检索效率差异并不是很大。所以不管非聚簇索引也好还是聚簇索引也好,都适合排序,聚簇索引仅仅比非聚簇索引快一点。


    结语

    好了,写了半天,手都累了。关于聚簇索引与非聚簇索引效率问题的实验就不做了,感兴趣的话可以自己使用查询分析器对查询计划进行分析。SQL Server是一个很复杂的系统,尤其是索引以及查询优化技术,Oracle就更复杂了。了解索引以及查询背后的事情不是什么坏事,它可以帮助我们更为深刻的了解我们的系统。

    转自:http://www.cnblogs.com/zhenyulu/articles/25794.html

     

     

    转载于:https://www.cnblogs.com/ivan-zheng/archive/2009/11/06/1597252.html

    展开全文
  • :数据存储在硬盘时候都是以为单位,即数据存储单位。无论文件大小如何,除非正好是簇的整数倍,否则文件所占用最后一个都会产生一些剩余空间。并且这些剩余空间不能为其他文件所用,即使是这个文件...

    :数据存储在硬盘的时候都是以簇为单位的,即数据存储的单位。无论文件的大小如何,除非正好是簇的整数倍,否则文件所占用的最后一个簇都会产生一些剩余空间。并且这些剩余空间不能为其他文件所用,即使是这个文件只有0字节,也不能允许两个文件及以上共用一个簇,否则会造成数据的混乱。

    CPI含义为每指令周期数,IPC即每周期指令数,CPI=1/IPC。

    PMU(Performance Monitoring Unit):性能监控单元。

    PI/Cycle事件计数指标,其中PI可以是任何一个PMU事件记数,cycle为处理器周期。

    icache用来缓存指令,dcache =用来缓存数据。cup与主存之间存在多级高速缓存,一般分为三级,分别为L1,L2,L3,代码由指令和数据组成。L1Cache比较特殊,每个CPU会有两个L1Cache,分别为指令高速缓存(Instruction Cache 简称ICache)和数据高速缓存(DataCache,简称dCache)。L2,L3一般不区分指令和数据,可以同时缓存指令和数据。

    为什么区分指令和数据?

    性能考量:CPU在执行程序时,可以同时获得指令和数据,做到硬件上的并行,另外指令和数据有很大的不同。如指令不会被修改,所以iCache在硬件设计上是可以只读的,这在一定程度上降低硬件设计的成本。

    DTB(Data Transfer Bus)数据传输总线

    DMA(Direct Memory Access,直接存储器访问)它允许不同速度的硬件装置来沟通,而不需要依赖于CPU的大量中断负载。DMA传输将数据从一个地址空间复制到另一个地址空间。当CPU初始化这个传输动作,传输动作本身是由DMA控制器来实行和完成。典型例子就是移动一个外部内存的区块到芯片内部更快的内存区。

    Mem(内存),MEM_ACCESS指应用程序的可用内存。

    API(Application Programming Interface,应用程序接口),是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。

    proc是一种虚拟文件系统,也叫进程数据文件系统,其信息不是存储在块设备中,在读取、proc目录下的文件的时候才会去动态生成。/proc文件系统可以获得很多进程信息。

    /proc文件系统的容量依系统而不同(如硬件配置、体系结构)。主要包括以下:

            系统进程的特征数据

             内存管理

             文件系统

             设备驱动程序

             系统总线

             电源管理

             终端

             系统控制参数

     

    展开全文
  • 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚索引。 不过这个定义太...
  • 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚索引。 不过这个定义太...
  • 在《数据库原理》里面,索引解释是:聚索引顺序就是数据物理存储顺序,而非聚索引解释是:索引顺序与数据物理排列顺序无关。正式因为如此,所以一个表最多只能有一个聚索引。不过这个定义太抽象...
  • MySQL官方索引定义为:索引(Index)是帮助MySQL高效获取数据数据结构。提取句子主干,就可以得到索引本质:索引是数据结构。 索引类型(关于数据结构方面知识请自行寻找): B-Tree索引 Hash索引 聚...
  • hbase系统中一张表会被水平切分成多个region。...我们先理解一下跳跃表知识。 跳跃表: 跳跃表是一种能高效实现插入,删除,查找内存数据结构。与红黑树以及二分法相比,跳跃表优势在于实现简单,可以实...
  • 从EM算法理解k-means与GMM关系

    千次阅读 2019-06-20 15:25:09
    EM(期望最大化)算法解决是在概率模型中含有无法观测隐含变量情况下...k-means:E过程,根据固定各个簇的中心点,每个样本就近分配所属的簇;M过程,根据样本划分好的簇,重新计算簇的中心点,更新E过...
  • Oracle性能诊断艺术(Oracle数据库优化的里程碑式著作) 基本信息 原书名: Troubleshooting Oracle Performance 原出版社: Apress 作者: (瑞)Christian Antognini 译者: 童家旺 胡怡文 冯大辉 丛书名: ...
  • 索引与数据引擎(myisam,innodb)的关系数据引擎(非聚与聚索引)对优化的影响索引的优化 运维方面 常规启动 复制与恢复 架构(核心:主从复制的模式) 高可用 读写分离 监控与优化 转载于:...

空空如也

空空如也

1 2 3 4
收藏数 80
精华内容 32
关键字:

对簇优化的理解