第 8 章 Redis对象
Redis基于C语言实现了一整套底层数据结构,用于Redis上层构件使用
- 简单动态字符串(SDS)
- 双端链表
- 跳跃表
- 字典
- 整数集合
- 压缩列表
然后Redis并没有直接使用这些数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统,这个系统包含五种类型的对象,每种对象都用到了至少一种我们前面所介绍的数据结构。
- 字符串对象
- 列表对象
- 哈希对象
- 集合对象
- 有序集合对象
8.1 对象的类型与编码
Redis使用对象来表示数据库中的键和值,每次当我们在Redis的数据库中新创建一个键值对时,我们至少会创建两个对象,一个对象用作键值对的键,另一个对象用作键值对的值。
Redis中的每个对象都由一个redisObject
结构表示,该结构中和保存数据有关的三个属性分别是type
属性、 encoding
属性和ptr
属性:
1 | typedef struct redisObject { |
- 其中,为了节省内存,前三个属性采用了位域,如
unsign type:4
,指定了type
属性使用前四个bit
下面将对上面代码的属性进行解读
8.1.1 类型
对象的type
属性记录了对象的类型,这个属性的值可以是下表列出的常量的其中一个。
对于Redis数据库保存的键值对来说,键总是一个字符串对象,而值则可以是这五种对象的任意一种。并且,当我们称呼一个键为“列表键”时,我们指的是“这个数据库键所对应的值为列表对象”。
TYPE
命令:当我们对一个数据库键执行TYPE
命令时,命令返回的结果为数据库键对应的值对象的类型。例如,列表键将返回列表类型。
8.1.2 编码
encoding
属性记录了对象所使用的编码,也即是说这个对象使用了什么数据结构作为对象的底层实现。每种类型的对象都至少使用了两种不同的编码,下表列出了每种类型的对象可以使用的编码。
使用OBJECT ENCODING
命令可以查看一个数据库键的值对象的编码
1 | redis> SET msg "hello, world" |
通过encoding
属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,极大地提升了Redis的灵活性和效率,因为Redis可以根据不同的使用场景来为一个对象设置不同的编码,从而优化对象在某一场景下的效率。
8.2 字符串对象
8.2.1 字符串对象的编码
字符串对象的编码可以是int
、raw
或者 embstr
-
int
- 如果一个字符串对象保存的是整数值,并且这个整数值可以
long
类型来表示 - 那么字符串对象会直接将整数值保存在字符串对象结构的
ptr
属性里面(将void*
转换成1ong
) - 并将字符串对象的编码设置为
int
。 - 例如下图
- 如果一个字符串对象保存的是整数值,并且这个整数值可以
-
raw
- 如果字符串对象保存的是一个字符串值,并且这个字符串值的长度大于32字节
- 那么字符串对象将使用一个简单动态字符串(
SDS
)来保存这个字符串值 - 并将对象的编码设置为
raw
- 例如下图
-
embstr
- 如果字符串对象保存的是一个字符串值,并且这个字符串值的长度小于等于32字节
- 那么字符串对象将使用
embstr
编码的方式来保存这个字符串值 - 这种编码和
raw
编码一样,都使用redisObject
结构和sdshdr
结构来表示字符串对象 embstr
编码只调用一次内存分配函数分配一块连续的空间,空间中依次包含redisObject
和sdshdr
两个结构,- 例如下图
使用embstr
编码的好处如下
- 将创建字符串对象所需的内存分配次数从
raw
编码的两次降低为一次 - 释放
embstr
编码的字符串对象只需要调用一次内存释放函数,而释放raw
编码的字符串对象需要调用两次内存释放函数 - 所有数据都保存在一块连续的内存里面
此外,浮点数在Redis中也是作为字符串值来存储的
8.2.1 字符串对象编码转换
int
到raw
的转换
- 对于
int
编码的字符串对象来说,如果我们向对象执行了一些命令,使得这个对象保存的不再是整数值,而是一个字符串值 - 那么字符串对象的编码将从
int
变为raw
。
embstr
到raw
的转换
- Redis没有为
embstr
编码的字符串对象编写任何相应的修改程序,所以embstr
编码的字符串对象实际上是只读的 embstr
编码的字符串对象在执行修改命令之后,总会变成一个raw
编码的字符串对象。
8.2.2 字符串命令的实现
8.3 列表对象
8.3.1 列表对象的编码
列表对象的编码可以是ziplist
或者linkedlist
ziplist
-
ziplist
编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点保存了一个列表元素 -
例如我们执行如下命令,创建一个包括三个元素的
numbers
列表键1
2redis> RPUSH numbers 1 "three" 5
(integer) 3 -
结果如下图
linkedlist
linkedlist
编码的列表对象使用双端链表作为底层实现,每个链表节点都保存了一个字符串对象,而每个字符串对象都保存了一个列表元素- 还是上面的
numbers
列表,在linkedlist
以下图结构存储
8.3.2 列表对象编码转换
当列表对象可以同时满足以下两个条件时,列表对象使用zip1ist
编码:
- 列表对象保存的所有字符串元素的长度都小于64字节
- 列表对象保存的元素数量小于512个
不能满足上述两个条件的列表对象需要使用linkedlist
编码。
当使用ziplist
编码所需的两个条件的任意一个不能被满足时,对象的编码转换操作就会被执行,原本保存在压缩列表里的所有列表元素都会被转移并保存到双端链表里面,对象的编码也会从zip1ist
变为linkedlist
8.3.3 列表命令的实现
8.4 哈希对象
8.4.1 哈希对象的编码
哈希对象的编码可以是ziplist
或者hashtable
ziplist
ziplist
编码的哈希对象使用压缩列表作为底层实现- 每当有键值对要新加入到哈希对象时
- 程序会先将保存了键的压缩列表节点推入到压缩列表表尾
- 然后再将保存了值的压缩列表节点推入到压缩列表表尾
- 保存了同一键值对的两个节点总是紧挨在一起
- 先添加到哈希对象中的键值对会被放在压缩列表的表头方向,而后添加到哈希对象中的键值对会被放在压缩列表的表尾方向。
- 例如下图
hashtable
hashtable
编码的哈希对象使用字典作为底层实现- 哈希对象中的每个键值对都使用一个字典键值对来保存
- 字典的每个键都是一个字符串对象,对象中保存了键值对的键
- 字典的每个值都是一个字符串对象,对象中保存了键值对的值。
- 例如下图
8.4.2 哈希对象编码转换
当哈希对象可以同时满足以下两个条件时,哈希对象使用ziplist
编码:
- 哈希对象保存的所有键值对的键和值的字符串长度都小于64字节
- 哈希对象保存的键值对数量小于512个
不能满足这两个条件的哈希对象需要使用hashtable
编码。
当使用ziplist
编码所需的两个条件的任意一个不能被满足时,对象的编码转换操作就会被执行,原本保存在压缩列表里的所有键值对都会被转移并保存到字典里面,对象的编码也会从zip1ist
变为hashtable
8.4.2 哈希命令的实现
8.5 集合对象
8.5.1 集合对象的编码
集合对象的编码可以是intset
或者hashtable
。
intset
intset
编码的集合对象使用整数集合作为底层实现,集合对象包含的所有元素都被保存在整数集合里面- 例如下图
hashtable
hashtable
编码的集合对象使用字典作为底层实现- 字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值则全部被设置为NULL。
8.5.2 集合对象编码转换
当集合对象可以同时满足以下两个条件时,对象使用intset
编码
- 集合对象保存的所有元素都是整数值
- 集合对象保存的元素数量不超过512个
不能满足这两个条件的集合对象需要使用 hashtable
编码。
8.5.3 集合命令的实现
8.6 有序集合对象
8.6.1 有序集合对象的编码
有序集合的编码可以是ziplist
或者skiplist
ziplist
zip1ist
编码的压缩列表对象使用压缩列表作为底层实现- 每个集合元素使用两个紧挨在一起的压缩列表节点来保存,第一个节点保存元素的成员(member),而第二个元素则保存元素的分值(score,作为排序的依据)
- 压缩列表内的集合元素按分值从小到大进行排序
- 例如下图
skiplist
skiplist
编码的有序集合对象使用zset
结构作为底层实现,一个zset
结构同时包含一个字典和一个跳跃表- 跳跃表按分值从小到大保存了所有集合元素,每个跳跃表节点都保存了一个集合元素:跳跃表节点的
object
属性保存了元素的成员,而跳跃表节点的score
属性则保存了元素的分值。 - 字典为有序集合创建了一个从成员到分值的映射,字典中的每个键值对都保存了一个集合元素:
- 字典的键保存了元素的成员
- 而字典的值则保存了元素的分值
- 通过这个字典,程序可以用 复杂度查找给定成员的分值
- 有序集合每个元素的成员都是一个字符串对象,而每个元素的分值都是一个
double
类型的浮点数 - 这两种数据结构都会通过指针共享相同元素的成员和分值,所以同时使用跳跃表和字典来保存集合元素不会产生重复成员或者分值
- 例如下图
8.6.2 有序集合对象编码转换
当有序集合对象可以同时满足以下两个条件时,对象使用ziplist
编码
- 有序集合保存的元素数量小于128个
- 有序集合保存的所有元素成员的长度都小于64字节
不能满足以上两个条件的有序集合对象将使用skiplist
编码
8.6.2 有序集合命令的实现
8.7 类型检查与命令多态
Redis中用于操作键的命令可以分为两种
- 其中一种命令可以对任何类型的键使用,例如
DEL
命令、EXPIRE
命令、RENAME
命令、TYPE
命令等,这种命令背后的实现机制是命令多态 - 另一种命令只能应用于特定类型的键,例如
SET
、GET
、APPEND
、STRLEN
等命令只能对字符串键执行,这种命令的实现需要经过类型检查
8.7.1 类型检查的实现
在执行一个类型特定的命令之前,Redis会先检查输入键的类型是否正确,然后再决定是否执行给定的命令。
类型特定命令所进行的类型检查是通过redisObject
结构的type
属性来实现的
- 在执行一个类型特定命令之前,服务器会先检查输入数据库键的值对象是否为执行命令所需的类型
- 如果是的话,服务器就对键执行指定的命令;否则,服务器将拒绝执行命令,并向客户端返回一个类型错误。
例如下图
8.7.1 多态命令的实现
Redis除了会根据值对象的类型来判断键是否能够执行指定命令之外,还会根据值对象的编码方式,选择正确的命令实现代码来执行命令。
如下图
8.8 内存回收
因为C语言并不具备自动内存回收功能,所以Redis在自己的对象系统中构建了一个引用计数技术实现的内存回收机制,通过这一机制,程序可以通过跟踪对象的引用计数信息,在适当的时候自动释放对象并进行内存回收。
每个对象的引用计数信息由redisObject
结构的 refCount
属性记录(可以查看本章第一节)
对象的引用计数信息会随着对象的使用状态而不断变化:
- 在创建一个新对象时,引用计数的值会被初始化为1
- 当对象被一个新程序使用时,它的引用计数值会被增一
- 当对象不再被一个程序使用时,它的引用计数值会被减一
- 当对象的引用计数值变为0时,对象所占用的内存会被释放
8.9 对象共享
除了用于实现引用计数内存回收机制之外,对象的引用计数属性还带有对象共享的作用。
在Redis中,让多个键共享同一个值对象需要执行以下两个步骤:
- 将数据库键的值指针指向一个现有的值对象;
- 将被共享的值对象的引用计数增一
例如下图
Redis只对包含整数值的字符串对象进行共享,也就是type
为StringObject
,encoding
为int
。
目前来说, Redis会在初始化服务器时,创建一万个字符串对象,这些对象包含了从0到9999的所有整数值,当服务器需要用到值为0到9999的字符串对象时,服务器就会使用这些共享对象,而不是新创建对象。
8.10 对象的空转时长
redisObject
结构包含的最后一个属性为lru
属性,该属性记录了对象最后一次被命令程序访问的时间
OBJECT IDLETIME
命令可以打印出给定键的空转时长,这一空转时长就是通过将当前时间减去键的值对象的lru时间计算得出的:
1 | SET msg "hello, world" |
8.11 本章重点
- Redis数据库中的每个键值对的键和值都是一个对象。
- Redis共有字符串、列表、哈希、集合、有序集合五种类型的对象,每种类型的对象至少都有两种或以上的编码方式,不同的编码可以在不同的使用场景上优化对象的使用效率。
- 服务器在执行某些命令之前,会先检查给定键的类型能否执行指定的命令。
- Redis的对象系统带有引用计数实现的内存回收机制,当一个对象不再被使用时,该对象所占用的内存就会被自动释放
- Redis会共享值为0到9999的字符串对象
- 对象会记录自己的最后一次被访问的时间,这个时间可以用于计算对象的空转时间。