大数据统计之基数估计(Cardinality Estimation)

本文详细介绍了CardinalityEstimation算法的四种实现方式:LinearCounting、LogLogCounting、HyperLogLogCounting及AdaptiveCounting,并探讨了它们在大数据计数场景下的应用。此外,文章还涉及基数估值算法在TDW中的实践,提供了Java实现超大数据去重计数的技术,以及基于Storm的Nginxlog实时监控系统中的基数计数案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、解读Cardinality Estimation算法(第一部分:基本概念)

http://blog.codinglabs.org/articles/cardinality-estimation.html

2、解读Cardinality Estimation算法(第二部分:Linear Counting)

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-ii.html

3、解读Cardinality Estimation算法(第三部分:LogLog Counting)

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iii.html

4、解读Cardinality Estimation算法(第四部分:HyperLogLog Counting及Adaptive Counting)

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iv.html

5、大数据计数:如何仅用1.5KB内存为十亿对象计数

http://www.csdn.net/article/2012-12-21/2813063-big-data-counting-how-to-count-

6、基数估值算法在TDW中的应用

http://mta.qq.com/mta/bigdata/?p=567

7、上述算法的开源库:stream-lib

https://github.com/addthis/stream-lib

8、Java使用极小的内存完成对超大数据的去重计数,用于实时计算中统计UV

http://lxw1234.com/archives/2015/09/516.htm

9、基于Storm的Nginx log实时监控系统:基数计数

http://tech.uc.cn/?p=2866#more-2866

10、大数据计数原理1+0=1这你都不会算(八)No.60

http://bit.ly/2yEPxns

转载于:https://my.oschina.net/leejun2005/blog/297461

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值