Redis Bitmap
1.什么叫做Redis的bitmap
即:操作String数据结构的key所存储的字符串指定偏移量上的位,返回原位置的值
1.1 优点:
节省空间:通过一个bit位来表示某个元素对应的值或者状态,其中key就是对应元素的值。实际上8个bit可以组成一个Byte,所以是及其节省空间的。
效率高:setbit和getbit的时间复杂度都是O(1),其他位运算效率也高。
2 Redis的bitmap API:
-
setbit
指定字符串偏移的位的值 -
setbit key offset value
> setbit login_month 1 1
0
> set login_month 2 1
ERR syntax error
> setbit login_month 2 1
0
对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。位的设置或清除取决于 value 参数,可以是 0 也可以是 1 。当 key 不存在时,自动生成一个新的字符串值。字符串会进行伸展(grown)以确保它可以将 value 保存在指定的偏移量上。当字符串值进行伸展时,空白位置以 0 填充。offset 参数必须大于或等于 0 ,小于 2^32 (bit 映射被限制在 512 MB 之内) 。对于大偏移量的setbit 操作申请内存会花费一定的时间。
-
getbit
获取指定偏移量上的位 ,当 offset 比字符串值的长度大,或者 key 不存在时,返回 0 。 -
getbit key offset
使用位图操作来进行字符串大小写转换
> getbit login_month 1
1
> getbit login_month 3
0
bitcount
统计字符串被设置为1的bit数
bitcount key [start end]
bitop
对一个或多个保存二进制位的字符串 key 进行位元操作,并将结果保存到 destkey 上。
bitop operation destkey key [key ...]
> set w hello
OK
> bitcount w
21
> bitcount w 0 0 #第一个字符中 1 的位数
3
> bitcount w 0 1 #前两个字符中 1 的位数
7
> bitpos w 0 #第一个 0 位
0
> bitpos w 1 #第一个 1 位
1
> bitpos w 1 1 1 #从第二个字符算起,第一个 1 位
9
> bitpos w 1 2 2 #从第三个字符算起,第一个 1 位
17
3. Redis的bitmap应用场景
两个命令都是效率高并且省内存,因为直接操作的是Redis存储的数据。
3.1 可以作为简单的布隆过滤器来判断用户是否执行过某些操作。
3.2 用户日活,月活,留存率的统计
实际是统计每天的用户数量。
- key:日期;
- offset:用户id【数字或者二进制】;
- value:是否登录/做任意操作;
按日期生成一个位图(bitmap)
- 计算日活:
bitcount key
获取key为1的数量; - 计算月活:可把30天的所有
bitmap
做or
计算,在进行bitcount
计算; - 计算留存率:
昨日留存=昨天今天连续登录的人数/昨天登录的人数
,即昨天的bitmap
与今天的bitmap
进行and
计算,在除以昨天bitcount
的数量。
3.3 实现用户上线次数的统计
实际上是以用户为主体
- key:用户id;
- offset:日期;
- value:是否上线;
setbit xiaopang 1 0;
记录小胖的上线天数,bitcount xiaopang
统计小胖的上线天数。
3.3 用户在线状态和人数统计
也是使用一个bitmap
,使用用户id
来充当offset
,上线标识是1,下线标识是0,也可轻松统计在线人数。
4.使用经验
- type = string,最大512M
- 注意setbit时的偏移量,可能有较大耗时
- 位图不是绝对好