【腾讯云CKV缓存】cloud key value·红黑树排名实现过程解析

问题

红黑树是一种自平衡的二叉查找树,它可以在O(logn)时间内执行查找、插入和删除。在c++ STL,linux内核中都有使用。

红黑树本身是有序的,现在问题是对于指定的元素,如何能快速查到它在整个元素集的排名,或者根据排名快速查询对应的元素?

思路

排名分顺序和逆序,这里只讨论顺序的情况。顺序的话排名就是求比当前元素小的元素的个数,根据红黑树的性质,左子树的节点都比根节点小,右子树的节点都比根节点大,求排名就等价于求节点左子树元素的个数。

根据树的递归性质,我们只需要在每个节点增加一个字段count用来统计当前节点子树的个数,同时在红黑树做插入、删除操作的时候更新count字段,就能在O(logn)的时间内查询到该元素的排名。

实现

红黑树节点增加count字段,count[x]表示x节点子节点元素的个数,包括它的左子树,它的右子树和它自己本身。

代码语言:txt
复制
count[x] = count[left[x]] + count[right[x]] + 1; // x非空
count[x] = 0; // x为空

红黑树旋转的时候,保证count满足我们的定义就可以。

左旋

左旋后:

代码语言:txt
复制
count[x] = count[α] + count[β] + 1
count[y] = count[x] + count[γ] + 1

左旋伪代码:

代码语言:javascript
复制
LEFT-ROTATE(T, x)
    y = right[x]
    right[x] = left[y]
    p[left[y]] = x
    p[y] = p[x]
    count[x] = count[left[x]] + count[left[right[x]]] + 1
    count[right[x]] = count[left[x]] + count[left[right[x]]] + count[right[right[x]]] + 2
    if p[x] == nil
    then root[T] = y
    else if x == left[p[x]]
        then left[p[x]] = y
        else right[p[x]] = y
    left[y] = x
    p[x] = y

右旋

右旋后:

代码语言:txt
复制
count[y] = count[γ] + count[β] + 1
count[x] = count[x] + count[α] + 1

右旋伪代码:

代码语言:javascript
复制
RIGHT-ROTATE(T, y)
    x = left[y]
    left[y] = right[x]
    p[right[x]] = y
    p[x] = p[y]
    count[y] = count[right[y]] + count[right[left[y]]] + 1
    count[left[y]] = count[right[y]] + count[left[left[y]]] + count[right[left[y]]] + 2
    if p[y] == nil
    then root[T] = x
    else if y == right[p[y]]
        then right[p[y]] = x
        else left[p[y]] = x
    right[x] = y
    p[y] = x

插入和删除的时候对于count的修改比较简单,只修改节点所有祖先节点的count,插入的时候,我们先按照红黑树的规则插入到指定位置,然后对该节点的所有祖先节点的count都增加1,然后再做平衡调整,删除的时候类似。

根据排名查询元素

跟红黑树普通的查询类似,只不过用来比较的域换成了count,这里分为三种情况:

1.节点左子树个数 + 1 == rank,表示已经找到需要查询的元素

2.节点左子树个数 + 1 > rank, 表示当前节点左子树个数大于rank - 1,我们需要在左子树中递归查询

3.节点左子树个数 + 1 < rank, 表示当前节点左子树个数大于rank - 1, 我们需要在右字数中查询,注意这个时候需要修改rank值

代码语言:javascript
复制
QUERYBYRANK(T, r)
    y = root[T]
    while y != nil
        if count[left[y]] + 1 == r then
            // find it
            exit
        else if count[left[y]] +1 > r then
            y = left[y]
        else
            r = r - count[left[y]] - 1
            y = right[y]

查询排名

红黑树普通查询,O(logn)可以查询到指定元素的排名

代码语言:javascript
复制
RANK(T, x)
    y = root[T]
    while y != nil
        if key[x] == key[y] then
            // find it
            r = count[y]
            exit
        else if key[x] < key[y] then
            y = left[y]
        else y = right[y]

总结

插入、删除、查找算法都是在原红黑树的基础上进行简单修改,时间复杂度均为O(logn)。

红黑树增加count扩展后,增加的count操作主要在红黑树的旋转,每次红黑树平衡最多3次旋转,所以对红黑树的性能影响很小,可以用来实现游戏中常见的排行榜功能。但是当元素集合的总量达到一定规模比如千万级,可能会有性能问题,主要消耗在红黑树key的字符串比较上。