DICT
简介
Redis是一个键值型(Key-Value Pair)的数据库,可以根据键实现快速的增删改查。而键与值的映射关系正是通过Dict来实现的。查找、插入和删除操作的时间复杂度均为 O(1)。
具体实现
Dict由三部分组成,从外到内分别是:字典(Dict)、哈希表(DictHashTable)、哈希节点(DictEntry)
Dict结构定义如下:
1 | typedef struct dict { |
DictHashTable结构定义如下:
1 | typedef struct dictht { |
DictEntry结构定义如下:
1 | typedef struct dictEntry { |
整体结构图示如下:
扩容缩容机制
Dict中的HashTable就是数组结合单向链表的实现,当集合中元素较多时,必然导致哈希冲突增多,链表过长,则查询效率会大大降低。
Dict在每次新增键值对时都会检查负载因子(LoadFactor = used/size) ,满足以下两种情况时会触发哈希表扩容:
- 哈希表的 LoadFactor >= 1,并且服务器没有执行 BGSAVE 或者 BGREWRITEAOF 等后台进程;
- 哈希表的 LoadFactor > 5 ;
扩容代码如下:
1 | static int _dictExpandIfNeeded(dict *d){ |
Dict除了扩容以外,每次删除元素时,也会对负载因子做检查,当LoadFactor < 0.1 时,会做哈希表收缩。
rehash实现
不管是扩容还是收缩,必定会创建新的哈希表,导致哈希表的size和sizemask变化,而key的查询与sizemask有关。因此必须对哈希表中的每一个key重新计算索引,插入新的哈希表,这个过程称为rehash。
过程是这样的:
-
计算新hash表的realeSize,值取决于当前要做的是扩容还是收缩:
- 如果是扩容,则新size为第一个大于等于ht[0].used + 1的2^n
- 如果是收缩,则新size为第一个大于等于ht[0].used的2^n (不得小于4)
-
按照新的realeSize申请内存空间,创建dictht,并赋值给ht[1]
-
设置dict.rehashidx = 0,标示开始rehash
-
将ht[0]中的每一个dictEntry都rehash到ht[1]
-
将ht[1]赋值给ht[0],给ht[1]初始化为空哈希表,释放原来的ht[0]的内存
-
将rehashidx赋值为-1,代表rehash结束
-
在rehash过程中,新增操作,则直接写入ht[1],查询、修改和删除则会在ht[0]和ht[1]依次查找并执行。这样可以确保ht[0]的数据只减不增,随着rehash最终为空
__END__