hyperloglog

发布时间 2023-07-09 14:27:02作者: 海山了-

hyperloglog

应用场景

统计某个网站的UV(Unique Visitor,独立访客, 一般理解为客户端IP(要考虑去重))

例如qq空间,还有bilibili视频的点击量

用户搜索网站关键词的数量

统计用户每天搜索不同词条个数

只保存对应的基数估计值(一个集合内不同元素的个数)而不保存对应的数据

为什么是估计值?因为有0.81%的误差

基本命令

  1. PFADD key element(添加指定元素到HyperLogLog中)
  2. PFCOUNT key[key...]获取对应的基数估计值(可以在一定程度上替换掉3,如果我们不需要保存对应的合并之后的基数的话)
  3. PFMERGE destkey sourcekey...