mysql数据库innoDB存储引擎来源-526互联

mysql数据库innoDB存储引擎来源

1、二叉查找树

从图中看出每个节点都存储着key和data，key就是表中的id，data代表中一行数据。
二叉查找树的特点就是任意节点的左子节点的key都小于当前节点的key，右子节点的key值都大于当前节点的key

应用场景：

查询id为17的key值，首先找到根节点，用id值和当前根节点作比较，大于当前节点取右子节点作为当前节点。
继续拿id为17的key值与当前节点13作比较，大于取右节点key为17作为当前节点。
拿id为17与当前节点17作比较，相等就取出来。
总共匹配了三次，如果不使用二叉查找就得查询七次。

2、平衡二叉树
在极端情况下二叉查找树会退化成单向链表。

如果数据比较极端会生成上述的二叉查找树，如果查询id为17的数据也需要匹配七次，只要二叉查找树的高度过高并且不平衡效率就会极低。
为了解决此问题就引出了平衡二叉树。
平衡二叉树的特点就是满足二叉查找树的基础上，添加一个新的要求，每个节点的左右子节点的高度差距不能超过1.

PS:如果对数据进行新增、修改、删除导致平衡二叉树不平衡时，那么平衡二叉树就根据节点的数据进行保持平衡。
PS:平衡二叉树相对于二叉查找树会更加稳定。

3、B树
数据库保证数据不丢失，将数据存储在磁盘中，相对于存储在内存中，查询速度差距几百倍或上万倍，而性能差距较大的主要原因就是频繁的IO操作。而当数据量较大的时候平衡二叉树就是出现n层的情况（平衡二叉树和二叉查找树的共同特点就是每个节点既存key也存data）。

通过上图可知数据量比较大的情况下平衡二叉树也会出现性能问题，因为单个节点只存单个key和单个data，为了解决此问题就从单节点入手。
创建一种可存储多个key和data的节点，这就是B树。

PS：存储单元称之为页（页其实就是每个磁盘的磁盘块）
通过上述图可知B树的特点就是单个节点可存储多个key和data，从而减少了树的高度，减少了磁盘IO读取操作次数，效率就上去了。

应用场景：查询id为29的数据

首先查询到页1，判断id为29在17和35中间，所以定位到页1中的p2指向页3。
判断id为29在页2中26和30中间，所以定位到页3中的p2指向页8。
在页8中在做比较，直接匹配到了id为29的数据。

4、B+树
B+就是B树的升级版，首先看下B+树的数据结构

B树和B+树的区别：
B+树除了叶子节点外，其它节点都存储多个key，只有叶子节点存储data，而B树则每个节点都存储key和data。

为什么要这样改变？

在innoDB存储引擎中，数据库的页大小是固定的，默认为16k。如果节点不存储data存储更多的key，那么就可以尽可能减少树的高度，查询从而减少读取磁盘IO次数。
B+树子节点中存储的数据都是有序排列的，如果使用B+树完成范围查询、排序查询、分组查询、去重查询就会很简单，效率特别高。而B树就不可以，数据都是分散在各个节点上。
B+树的每页之间是一个双向链表进行链接，叶子节点中的数据采用单向链表进行链接。但是需要记得一旦是B树可以加链表。
PS：InnoDB的存储结构就是B+树，聚集索引就是上面的结构。myisam依然用的B+树，结构一样，唯一不同的就是叶子节点中存储的不是data而是data的文件地址。

5、聚集索引和非聚集索引