欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Redis中3种特殊的数据类型(BitMap、Geo和HyperLogLog)

程序员文章站 2024-01-08 11:57:04
前言 reids 在 web 应用的开发中使用非常广泛,几乎所有的后端技术都会有涉及到 redis 的使用。redis 种除了常见的字符串 string、字典 hash、...

前言

reids 在 web 应用的开发中使用非常广泛,几乎所有的后端技术都会有涉及到 redis 的使用。redis 种除了常见的字符串 string、字典 hash、列表 list、集合 set、有序集合 sortedset 等等之外,还有一些不常用的数据类型,这里着重介绍三个。下面话不多说了,来一起看看详细的介绍吧。

bitmap

bitmap 就是通过一个 bit 位来表示某个元素对应的值或者状态, 其中的 key 就是对应元素本身,实际上底层也是通过对字符串的操作来实现。redis 从 2.2 版本之后新增了setbit, getbit, bitcount 等几个 bitmap 相关命令。虽然是新命令,但是本身都是对字符串的操作,我们先来看看语法:

setbit key offset value

其中 offset 必须是数字,value 只能是 0 或者 1,咋一看感觉没啥用处,我们先来看看 bitmap 的具体表示,当我们使用命令 setbit key (0,2,5,9,12) 1后,它的具体表示为:

byte bit0 bit1 bit2 bit3 bit4 bit5 bit6 bit7
byte0 1 0 1 0 0 1 0 0
byte1 0 1 0 0 1 0 0 0

可以看出 bit 的默认值是 0,那么 bitmap 在实际开发的运用呢?这里举一个例子:储存用户在线状态。这里只需要一个 key,然后把用户 id 作为 offset,如果在线就设置为 1,不在线就设置为 0。实例代码:

//设置在线状态
$redis->setbit('online', $uid, 1);

//设置离线状态
$redis->setbit('online', $uid, 0);

//获取状态
$isonline = $redis->getbit('online', $uid);

//获取在线人数
$isonline = $redis->bitcount('online');

geo

redis 的 geo 特性在 redis 3.2 版本中推出, 这个功能可以将用户给定的地理位置信息储存起来, 并对这些信息进行操作。geo 的数据结构总共有六个命令:geoadd、geopos、geodist、georadius、georadiusbymember、gethash,这里着重讲解几个。

1.geoadd

geoadd key longitude latitude member [longitude latitude member ...]

将给定的空间元素(纬度、经度、名字)添加到指定的键里面。 这些数据会以有序集合的形式被储存在键里面, 从而使得像 georadius 和 georadiusbymember 这样的命令可以在之后通过位置查询取得这些元素。例子:

redis> geoadd sicily 13.361389 38.115556 "palermo" 15.087269 37.502669 "catania"
(integer) 2

2.geopos

geopos key member [member ...]

从键里面返回所有给定位置元素的位置(经度和纬度),例子:

redis> geopos sicily palermo catania nonexisting
1) 1) "13.361389338970184"
 2) "38.115556395496299"

3.geodist

geodist key member1 member2 [unit]

返回两个给定位置之间的距离。如果两个位置之间的其中一个不存在, 那么命令返回空值。指定单位的参数 unit 必须是以下单位的其中一个:(默认为m)

m   表示单位为米。
km  表示单位为千米。
mi  表示单位为英里。
ft  表示单位为英尺。

redis> geodist sicily palermo catania
"166274.15156960039"

4.georadius

georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [asc|desc] [count count]

以给定的经纬度为中心, 返回键包含的位置元素当中, 与中心的距离不超过给定最大距离的所有位置元素。距离单位和上面的一致,其中后面的选项:

withdist: 在返回位置元素的同时, 将位置元素与中心之间的距离也一并返回。距离的单位和用户给定的范围单位保持一致。
withcoord: 将位置元素的经度和维度也一并返回。
withhash: 以 52 位有符号整数的形式, 返回位置元素经过原始 geohash 编码的有序集合分值。这个选项主要用于底层应用或者调试, 实际中的作用并不大。

redis> georadius sicily 15 37 200 km withdist
1) 1) "palermo"
 2) "190.4424"
2) 1) "catania"
 2) "56.4413"

hyperloglog

redis 的基数统计,这个结构可以非常省内存的去统计各种计数,比如注册 ip 数、每日访问 ip 数、页面实时uv)、在线用户数等。但是它也有局限性,就是只能统计数量,而没办法去知道具体的内容是什么。

当然用集合也可以解决这个问题。但是一个大型的网站,每天 ip 比如有 100 万,粗算一个 ip 消耗 15 字节,那么 100 万个 ip 就是 15m。而 hyperloglog 在 redis 中每个键占用的内容都是 12k,理论存储近似接近 2^64 个值,不管存储的内容是什么,它一个基于基数估算的算法,只能比较准确的估算出基数,可以使用少量固定的内存去存储并识别集合中的唯一元素。而且这个估算的基数并不一定准确,是一个带有 0.81% 标准错误的近似值。

这个数据结构的命令有三个:pfadd、pfcount、pfmerge

1.pfadd

redis> pfadd databases "redis" "mongodb" "mysql"
(integer) 1

redis> pfadd databases "redis"  # redis 已经存在,不必对估计数量进行更新
(integer) 0

2.pfcount

redis> pfcount databases
(integer) 3

3.pfmerge

pfmerge destkey sourcekey [sourcekey ...]

将多个 hyperloglog 合并为一个 hyperloglog, 合并后的 hyperloglog 的基数接近于所有输入 hyperloglog 的可见集合的并集。合并得出的 hyperloglog 会被储存在 destkey 键里面, 如果该键并不存在,那么命令在执行之前, 会先为该键创建一个空的 hyperloglog 。

redis> pfadd nosql "redis" "mongodb" "memcached"
(integer) 1
redis> pfadd rdbms "mysql" "mssql" "postgresql"
(integer) 1
redis> pfmerge databases nosql rdbms
ok
redis> pfcount databases
(integer) 6

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。

上一篇:

下一篇: