Redis（九）五种数据类型的底层结构-526互联

string是redis中最常见的数据类型

基本编码方式是RAW，基于简单动态字符串（SDS）实现，存储上限为512MB，此时的object head和SDS是两个独立的空间，是通过redisObject的buf指针指向的实际存储的SDS
如果存储的SDS长度小于44字节，则采用EMBSTR编码，此时的object head和SDS是一段连续的内存空间，申请空间的时候只需要申请一次内存分配，效率更高。超过44字节，否则会自动变为RAW编码

为什么采用小于44字节使用EMB编码？

因为object head总共占用20字节，加上44字节后是64字节，正好是redis内存分配的一个分片大小，这样不容易造成内存碎片，因此使用string的时候，尽量不要超过44字节，否则会自动变为RAW编码
INT编码则是将数字转化为二进制直接存储到redisObject的ptr指针部分，占用8字节

在3.2版本之前，redis采用ZipList和LinkedList来实现的List，当元素个数小于512并且元素大小小于64字节的时候就采用ZiplList编码，超过则采用LinkedList编码
在3.2版本之后，redis统一采用QuickList来实现list，实现原理：
- 首先针对list的key和value各建立一个RedisObject，value的RedisObject包含：
  - type类型为list
  - encoding编码为QuickList
  - lru：最近一次使用时间
  - refcount：引用计数
  - ptr：指向实际存储的QuickList空间
- 然后QuickList的节点通过前后指针连接成双向链表，每个QuickList节点的zip指针指向存放真实数据的压缩链表

为了满足redis的list类型数据可以从首尾操作列表元素的特性，
如果采用LinkedList普通链表，可以实现两端访问，但是由于非连续空间需要指针，所以内存占用较高、内存碎片也比较多
如果采用ZipList压缩链表，可以实现两端访问并且内存占用较低，但是存储的上限也比较低
因此采用QuickList即LinkedList+ZipList的方式，LinkedList的底层节点为一个个的ZipList，既可以实现双端访问，而且内存占用较低，同时包含多个ZIpList存储上限也比较高

Zset也就是SortedSet，每个元素都需要保存一个score值和一个member值，member必须唯一，可以根据score值进行排序，也可以根据member查询score
Zset底层编码可以采用ZipList或者HashTable+SkipList组合的方式
当元素个数不多的时候，HashTable+SkipList的组合发挥不出性能优势但是内存占用较多，因此采用ZipList编码：（个数的界限是：元素数量小于zset_max_ziplist_sntries，默认128且每个元素大小小于zset_max_ziplist_value，默认64字节）
- 由于ZipList本身既没有键值对，也没有排序的功能，因此需要通过编码实现：
  - ZipLIst是连续的内存，因此可以让element和score占用两个连续的entry实现键值对的存储
  - 通过编码实现排序，每次插入的时候score越小就放到队首，越大就放到队尾
  - 查询也是通过遍历的方式
  - 因为存储元素数量很少，因此时间消耗不会太多但是内存占用远小于HashTable+SkipList的组合
而当元素个数很多的时候，则采用HashTable+SkipList的组合：
- HashTable可以存储键值对，并且能够保证key唯一、实现通过key快速查找value(score)，而SkipList能够同时存储element和score（key、value对应element和score），并实现根据score的排序和范围查询
- 而在更新的时候，只需要先通过查询HashTable是否存在key，然后依次更新HashTable和SkipList即可

为了满足Zset每个元素都需要保存一个score值和一个member值，member必须唯一，可以根据score值进行排序，也可以根据member查询score的特性
底层的数据结构中，HashTable能够实现键值对的存储，并且能够保证key唯一、实现通过key快速查找value(score)，但是是无序的，不能够对score进行排序
SkipList则可以根据score进行排序和范围查询，但是本身不能保证key唯一
因此采用HashTable+SkipList的组合