MySQL——索引底层-526互联

索引

索引是存储引擎用于快速获取数据的一种数据结构，目的是减少磁盘I/O次数，提高数据库性能。

索引是在存储引擎中实现的，因此每种存储引擎的索引不一定完全相同。

频繁作为查询条件（不包括唯一性太差的字段，如男女）的字段应该创建索引。

代价

1、额外的磁盘占用

2、对表进行DML（增删改）操作后，需要对索引进行维护。真正对服务器造成压力的是查询操作。

索引的种类

1、主键索引（聚簇索引）（特殊的唯一索引，增加了NOT NULL的约束）

ALTER TABLE table2 ADD PRIMARY KEY (id);

2、唯一索引（UNIQUE）

表中有primary key后不能用unique index

CREATE UNIQUE INDEX id_index on table2 (id);
ALTER TABLE table2 ADD UNIQUE id_index (id);

3、普通索引（二级索引）（最多）

ALTER TABLE table2 ADD INDEX id_index (id);

数据存储（InnoDB）

底层理解主键索引（聚簇索引/B+树）

InnoDB存储引擎将一张表的数据划分为若干个InnoDB数据页，以InnoDB数据页作为磁盘和内存之间交互的最小单位：

InnoDB数据页有自己的存储格式，实际存储的数据按照指定的行格式存储在User Records部分：

InnoDB数据页的默认大小为16KB，在一个数据页中，用户记录是按照主键由小到大的顺序串联而成的单向链表。每一个数据页中，InnoDB会自动添加两条伪记录，分别是Infimum最小记录和Supremum最大记录：

InnoDB将一个数据页中的所有记录分成若干个小组，Infimum伪记录单独分成1组，Supremum伪记录所在的分组记录条数只能在1_{8之间，其余分组记录条数只能在4}8之间。每个小组选出组内主键值最大的一条记录作为小组长，小组长添加一个属性记录组员个数（包括自己），并把小组长的地址取出编成目录（槽），槽在物理空间上是连续的，意味着很容易找到它的上一个和下一个，所以可以用二分查找对槽进行快速查找从而定位到具体的某个记录：