精华内容
下载资源
问答
  • 深入理解 MySQL 索引底层原理 Mysql 作为互联网中非常热门的数据库,其底层的存储引擎和数据检索引擎的设计非常重要,尤其是 Mysql 数据的存储形式以及索引的设计,决定了 Mysql 整体的数据检索性能。 何为索引 我们...
  • mysql索引底层原理分析

    mysql索引底层原理分析

    展开全文
  • mysql索引底层原理mysql 引擎什么是索引数据结构什么是B树B树结构图什么是B+树两者有什么不同之处mysql索引为什么用B+树了解了mysql 索引底层有什么用 mysql 引擎 MyISAM 引擎和 InnoDb引擎 用表对比: 引擎 主...

    mysql 引擎

    MyISAM 引擎和 InnoDb引擎

    用表对比:

    引擎 主外键 事务 缓存 索引数据结构 关注点 表空间
    MyISAM × × 表锁 只缓存索引 B+Tree 非聚集 性能
    InnoDb 行锁 缓存索引和数据,对内存要求较高 B+Tree 聚集性 事务

    什么是索引

    索引:通过某种算法高效获取数据的一种数据结构。

    数据结构

    B-Tree 、B+Tree、B*Tree、红黑树
    (重点说B-Tree和B+Tree),红黑树(底层是平衡二叉搜索树)

    B-Tree 也叫B 树。B+Tree也叫B+树。

    什么是B树

    B树是多叉平衡查找树,可以联想到红黑树的二叉查找树。数据量大的时候,B树可保证查询效率,因为不会像二叉结构层次深。

    记住几个专业术语: 根节点、叶子节点、关键字、阶、关键字个数、指针。

    1. 关键字个数: [ceil(m/2)-1] <= n <= m-1 (假设B树为m阶)

    B树结构图

    B树结构图

    什么是B+树

    B树的变形。

    B+树的图

    在这里插入图片描述

    两者有什么不同之处

    B树:

    1. 叶子节点不包含关键字信息 叶子节点没有指向孩子节点的指针

    B+树:

    1. 所有叶子节点包含全部关键字信息,及指向含有这些关键字记录的指针,且叶子节点中关键字进行有序链接
    2. 非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层;
    3. B树是非聚集索引,索引和数据分开存储。
    4. B+树聚集索引,索引和数据存在一起。

    mysql索引为什么用B+树

    • 查询效率高
      为什么效率高,因为B+树遍历叶子节点就能遍历整棵树,基于范围查询。
      B树提升了IO性能,却没解决循环遍历元素效率低的问题。
    • 磁盘读写代价低
      为什么?因为B+树内部节点没有指向关键字的指针,内部节点相对B数更小。

    了解了mysql 索引底层有什么用

    1. 尽量设置主键自增
      • 为什么?
        因为如果设置非规律性索引,底层是B+树,会导致为了维护树的特性不断分裂,十分低效。
    2. 主键字段不应过长,因为辅助索引引用主索引,主键过长导致辅助索引过长。
    展开全文
  • Mysql索引底层原理分析, Mysql索引的本质 Mysql索引的底层原理 Mysql索引的实战经验 面试 问:数据库中最常见的慢查询优化方式是什么? 同学A:加索引。 问:为什么加索引能优化慢查询?同学A:…不知道同学B:因为...

    Mysql索引底层原理分析,
    Mysql索引的本质

    Mysql索引的底层原理

    Mysql索引的实战经验

    面试
    问:数据库中最常见的慢查询优化方式是什么? 同学A:加索引。

    问:为什么加索引能优化慢查询?同学A:…不知道同学B:因为索引其实就是一种优化查询的数据结构,比如Mysql中的索引是用B+树实现的,而B+树就是一种数据结构,可以优化查询速度,可以利用索引快速查找数据,所以能优化查询。

    问:你知道哪些数据结构可以提高查询速度?(听到这个问题就感觉此处有坑…)同学B:哈希表、完全平衡二叉树、B树、B+树等等。

    问:那这些数据结构既然都能优化查询速度,那Mysql种为何选择使用B+树?同学B:…不知道

    提问
    SHOW INDEX FROM employees.titles;

    640?wx_fmt=png

    有一个titles表,主键由empno,title,fromdate三个字段组成。

    那么以下几个语句会用到索引吗?

    select*fromemployees.titleswhereemp_no=1

    select*fromemployees.titleswheretitle=‘1’

    select*fromemployees.titleswhereemp_no='1’andtitle=1

    select*fromemployees.titleswheretitle='1’andemp_no=1

    为什么哈希表、完全平衡二叉树、B树、B+树都可以优化查询,为何Mysql独独喜欢B+树?
    哈希表有什么特点?
    假如有这么一张表(表名:sanguo):

    640?wx_fmt=png

    现在对name字段建立哈希索引:

    640?wx_fmt=jpeg

    注意字段值所对应的数组下标是哈希算法随机算出来的,所以可能出现哈希冲突。那么对于这样一个索引结构,现在来执行下面的sql语句:

    select*fromsanguowherename=‘周瑜’

    可以直接对‘周瑜’按哈希算法算出来一个数组下标,然后可以直接从数据中取出数据并拿到锁对应那一行数据的地址,进而查询那一行数据。 那么如果现在执行下面的sql语句:

    select*fromsanguowherename>‘周瑜’

    则无能为力,因为哈希表的特点就是可以快速的精确查询,但是不支持范围查询。

    如果用完全平衡二叉树呢?
    还是上面的表数据用完全平衡二叉树表示如下图(为了简单,数据对应的地址就不画在图中了。):

    640?wx_fmt=jpeg

    图中的每一个节点实际上应该有四部分:

    左指针,指向左子树

    键值

    键值所对应的数据的存储地址

    右指针,指向右子树

    另外需要提醒的是,二叉树是有顺序的,简单的说就是“左边的小于右边的”假如我们现在来查找‘周瑜’,需要找2次(第一次曹操,第二次周瑜),比哈希表要多一次。而且由于完全平衡二叉树是有序的,所以也是支持范围查找的。

    如果用B树呢?
    还是上面的表数据用B树表示如下图(为了简单,数据对应的地址就不画在图中了。):

    640?wx_fmt=jpeg

    可以发现同样的元素,B树的表示要比完全平衡二叉树要“矮”,原因在于B树中的一个节点可以存储多个元素。

    如果用B+树呢?
    还是上面的表数据用B+树表示如下图(为了简单,数据对应的地址就不画在图中了。):

    640?wx_fmt=jpeg

    我们可以发现同样的元素,B+树的表示要比B树要“胖”,原因在于B+树中的非叶子节点会冗余一份在叶子节点中,并且叶子节点之间用指针相连。

    那么B+树到底有什么优势呢?
    这里我们用“反证法”,假如我们现在就用完全平衡二叉树作为索引的数据结构,我们来看一下有什么不妥的地方。实际上,索引也是很“大”的,因为索引也是存储元素的,我们的一个表的数据行数越多,那么对应的索引文件其实也是会很大的,实际上也是需要存储在磁盘中的,而不能全部都放在内存中,所以我们在考虑选用哪种数据结构时,我们可以换一个角度思考,哪个数据结构更适合从磁盘中读取数据,或者哪个数据结构能够提高磁盘的IO效率。回头看一下完全平衡二叉树,当我们需要查询“张飞”时,需要以下步骤

    从磁盘中取出“曹操”到内存,CPU从内存取出数据进行笔记,“张飞”<“曹操”,取左子树(产生了一次磁盘IO)

    从磁盘中取出“周瑜”到内存,CPU从内存取出数据进行笔记,“张飞”>“周瑜”,取右子树(产生了一次磁盘IO)

    从磁盘中取出“孙权”到内存,CPU从内存取出数据进行笔记,“张飞”>“孙权”,取右子树(产生了一次磁盘IO)

    从磁盘中取出“黄忠”到内存,CPU从内存取出数据进行笔记,“张飞”=“张飞”,找到结果(产生了一次磁盘IO)

    同理,回头看一下B树,我们发现只发送三次磁盘IO就可以找到“张飞”了,这就是B树的优点:一个节点可以存储多个元素,相对于完全平衡二叉树所以整棵树的高度就降低了,磁盘IO效率提高了。

    而B+树是B树的升级版,只是把非叶子节点冗余一下,这么做的好处是为了提高范围查找的效率。

    到这里可以总结出来,Mysql选用B+树这种数据结构作为索引,可以提高查询索引时的磁盘IO效率,并且可以提高范围查询的效率,并且B+树里的元素也是有序的。

    那么,一个B+树的节点中到底存多少个元素合适呢?
    其实也可以换个角度来思考B+树中一个节点到底多大合适?

    答案是:B+树中一个节点为一页或页的倍数最为合适。因为如果一个节点的大小小于1页,那么读取这个节点的时候其实也会读出1页,造成资源的浪费;如果一个节点的大小大于1页,比如1.2页,那么读取这个节点的时候会读出2页,也会造成资源的浪费;所以为了不造成浪费,所以最后把一个节点的大小控制在1页、2页、3页、4页等倍数页大小最为合适。

    那么,Mysql中B+树的一个节点大小为多大呢?
    这个问题的答案是“1页”,这里说的“页”是Mysql自定义的单位(其实和操作系统类似),Mysql的Innodb引擎中一页的默认大小是16k(如果操作系统中一页大小是4k,那么Mysql中1页=操作系统中4页),可以使用命令SHOW GLOBAL STATUS like ‘Innodbpagesize’; 查看。

    并且还可以告诉你的是,一个节点为1页就够了。

    为什么一个节点为1页(16k)就够了?
    解决这个问题,我们先来看一下Mysql中利用B+树的具体实现。如果想要这篇文章视频资料的话可以扫一下下面这位小姐姐的微信,暗号:666。

    640?wx_fmt=png

    640?wx_fmt=png

    Mysql中MyISAM和innodb使用B+树
    640?wx_fmt=jpeg

    通常我们认为B+树的非叶子节点不存储数据,只有叶子节点才存储数据;而B树的非叶子和叶子节点都会存储数据,会导致非叶子节点存储的索引值会更少,树的高度相对会比B+树高,平均的I/O效率会比较低,所以使用B+树作为索引的数据结构,再加上B+树的叶子节点之间会有指针相连,也方便进行范围查找。上图的data区域两个存储引擎会有不同。

    MyISAM中的B+树
    MYISAM中叶子节点的数据区域存储的是数据记录的地址

    主键索引
    640?wx_fmt=png

    辅助索引
    640?wx_fmt=png

    MyISAM存储引擎在使用索引查询数据时,会先根据索引查找到数据地址,再根据地址查询到具体的数据。并且主键索引和辅助索引没有太多区别。

    InnoDB中的B+树
    InnoDB中主键索引的叶子节点的数据区域存储的是数据记录,辅助索引存储的是主键值

    主键索引
    640?wx_fmt=png

    640?wx_fmt=png

    辅助索引
    640?wx_fmt=jpeg

    Innodb中的主键索引和实际数据时绑定在一起的,也就是说Innodb的一个表一定要有主键索引,如果一个表没有手动建立主键索引,Innodb会查看有没有唯一索引,如果有则选用唯一索引作为主键索引,如果连唯一索引也没有,则会默认建立一个隐藏的主键索引(用户不可见)。另外,Innodb的主键索引要比MyISAM的主键索引查询效率要高(少一次磁盘IO),并且比辅助索引也要高很多。所以,我们在使用Innodb作为存储引擎时,我们最好:

    手动建立主键索引

    尽量利用主键索引查询

    回到我们的问题:为什么一个节点为1页(16k)就够了?
    对着上面Mysql中Innodb中对B+树的实际应用(主要看主键索引),可以发现B+树中的一个节点存储的内容是:

    非叶子节点:主键+指针

    叶子节点:数据

    那么,假设我们一行数据大小为1K,那么一页就能存16条数据,也就是一个叶子节点能存16条数据;再看非叶子节点,假设主键ID为bigint类型,那么长度为8B,指针大小在Innodb源码中为6B,一共就是14B,那么一页里就可以存储16K/14=1170个(主键+指针),那么一颗高度为2的B+树能存储的数据为:117016=18720条,一颗高度为3的B+树能存储的数据为:11701170*16=21902400(千万级条)。所以在InnoDB中B+树高度一般为1-3层,它就能满足千万级的数据存储。在查找数据时一次页的查找代表一次IO,所以通过主键索引查询通常只需要1-3次IO操作即可查找到数据。所以也就回答了我们的问题,1页=16k这么设置是比较合适的,是适用大多数的企业的,当然这个值是可以修改的,所以也能根据业务的时间情况进行调整。

    最左前缀原则
    我们模拟数据建立一个联合索引 select*,concat(right(emp_no,1),"-",right(title,1),"-",right(from_date,2))fromemployees.titles limit10;

    640?wx_fmt=png

    那么对应的B+树为

    640?wx_fmt=png

    我们判断一个查询条件能不能用到索引,我们要分析这个查询条件能不能利用某个索引缩小查询范围

    对于 selectfromemployees.titleswhereemp_no=1是能用到索引的,因为它能利用上面的索引所有查询范围,首先和第一个节点“4-r-01”比较,1<4,所以可以直接确定结果在左子树,同理,依次按顺序进行比较,逐步可以缩小查询范围。对于 selectfromemployees.titleswheretitle='1’是不能用到索引的,因为它不能用到上面的所以,和第一节点进行比较时,没有empno这个字段的值,不能确定到底该去左子树还是右子树继续进行查询。对于 select*fromemployees.titleswheretitle='1’andemp_no=1是能用到索引,按照我们的上面的分析,先用title='1’这个条件和第一个节点进行比较,是没有结果的,但是mysql会对这个sql进行优化,优化之后会将empno=1这个条件放到第一位,从而可以利用索引。

    展开全文
  • 深入理解 Mysql 索引底层原理 - https://zhuanlan.zhihu.com/p/113917726

    深入理解 Mysql 索引底层原理 - https://zhuanlan.zhihu.com/p/113917726

    展开全文
  • 深入理解Mysql索引底层原理 一步一步推导出Mysql索引的底层数据结构。 Mysql作为互联网中非常热门的数据库,其底层的存储引擎和数据检索引擎的设计非常重要,尤其是Mysql数据的存储形式以及索引的设计,决定了...
  • Mysql索引底层原理与性能优化 在一般的开发中不会有碰到数据结构、算法的一些底层东西。但是了解了之后会对你的开发有很大的帮助。最近学习了一下。做一个笔记。更深的学习,请看相关书籍或视频。 一、索引是帮助...
  • Mysql索引底层原理(一)(二叉树、红黑树、B树、B+树) https://blog.csdn.net/qq_37989738/article/details/105045096 Mysql索引底层原理(二)(数据表存储引擎) ...Mysql锁机制与事务隔离级别 ...MySQL
  • mysql索引数据结构联合索引 数据结构动态展示网站 1. 常见树结构 二叉树 红黑树 Hash 表 B-tree 1.1 二叉树 1.1 非自增数据插入 1.1.2 自增数据插入 二叉树查找 1.1.1 自增查找是一个类似于全表扫描的过程,在...
  • Mysql索引底层原理(一)(二叉树、红黑树、B树、B+树) 对于有千万行记录的数据表,查询速度和效率愈发重要,这直接影响到用户的体验。讲解Mysql索引底层原理之前,先来聊聊二叉树、红黑树、B树、B+树。 (1)二叉树 ...
  • Mysql索引的本质Mysql索引底层原理Mysql索引的实战经验面试问:数据库中最常见的慢查询优化方式是什么?答:加索引。问:为什么加索引能优化慢查询?答1:...不知道答2:因为索引其实就是一种优化查询的数据结构,...
  • 一文读懂mysql索引底层原理

    千次阅读 2019-03-19 10:59:00
    Mysql官方对索引的定义为:索引是帮助Mysql高效获取数据的数据结构,简单来说:索引就是数据结构. 数据库的底层索引是用B树和B+树实现的,但是为什么使用的是它们,为什么不用红黑树? 红黑树等数据结构也可以用来...
  • 首先,大家要清楚mysql索引底层使用的树形数据结构是B+Tree,并不是B-Tree;为什么不是二叉树,红黑树,B-Tree呢,大家可以自行百度,这儿就不一一说明了。 先放一张B+Tree的图: 这是单值索引时底层的样子。用单值...
  • 从结果中可以到titles表的主索引为<emp_no, title, from_date>,还有一个辅助索引<...为了避免多个索引使事情变复杂(MySQL的SQL优化器在多索引时行为比较复杂),这里我们将辅助索引drop掉:
  • 答2:因为索引其实就是一种优化查询的数据结构,比如Mysql中的索引是用B+树实现的,而B+树就是一种数据结构,可以优化查询速度,可以利用索引快速查找数据,所以能优化查询。 问:你知道哪些数据结构可以提高查询...
  • 【2】索引底层原理实现以及主键索引、辅助索引、聚集索引、非聚集索引 MyISAM存储引擎 - 主键索引 MyISAM存储引擎 - 辅助索引 InnoDB存储引擎 - 主键索引 InnoDB存储引擎 - 辅助索引 【3】B+树和B-树的区别 【1...
  • MySQL官方对于索引的定义为:索引是帮助MySQL高效获取数据的数据结构。即:索引是数据结构。 我们知道,数据库查询是数据库最主要的功能之一,我们都希望查询数据的速度尽可能的快,因此数据库系统的设计者会从...
  • MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。提取句子主干,就可以得到索引的本质:索引是数据结构。我们知道,数据库查询是数据库的最主要功能之一。我们都希望查询数据的速度能尽...
  • MySQL innoDB索引底层原理详解

    万次阅读 多人点赞 2016-09-02 21:25:22
    本文介绍MySQL的InnoDB索引相对底层原理相关知识,涉及到B+Tree索引和Hash索引,但本文主要介绍B+Tree索引,其中包括聚簇索引和非聚簇索引,InnoDB数据页结构详解,B+Tree索引的使用以及优化,同时还有B+Tree索引的...
  • 目录MySQL索引优化底层原理索引的本质索引数据结构 MySQL索引优化底层原理 慢查询如何优化? 一条sql一般执行几到几十毫秒,但是在千万级别的数据表面前,查询很慢,几秒或者甚至几十秒,我们一般通过索引优化查询,...
  • Mysql索引底层原理 1.什么是索引? 索引是一种排好序的数据结构,mysql目前默认使用的是b+树。 2.为什么使用b+树? 例如表table 数据 id name 1 zs 2 ls 3 sa 4 zl 5 wmz ...
  • MySql索引底层

    2019-08-16 16:03:56
    好久没有写博客了,前几天看了一个关于索引底层原理的学习视频,虽然是技术小白,但也是整理下自己学到或者理解的一些知识吧,不喜勿喷,欢迎交流! MySql索引的底层原理 1.索引的定义 MySQL官方对索引的定义为:...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 40,586
精华内容 16,234
关键字:

mysql索引的底层原理

mysql 订阅