dgim算法的python实现:压缩数据结构以估计布尔流最后n个元素中的“true”个数。

dgim的Python项目详细描述


https://badge.fury.io/py/dgim.pnghttps://travis-ci.org/simondolle/dgim.png?branch=masterhttps://pypip.in/d/dgim/badge.png

DGIM算法的Python实现: 一种紧凑的数据结构,用于估计布尔流最后n个元素中的true语句数。

功能

  • 布尔流最后n个元素中“true”语句数的估计
  • 内存占用率低。
  • 可调错误率(错误率越低,内存占用率越高)

应用程序

当处理大量数据流时,如点击流、服务器日志、财务流。 通常需要维护关于n个最新元素的统计信息。 如果n很大或者有许多流要处理,则无法存储 n个最新元素。

在这种情况下,如果处理的流是布尔型的, dgim算法可以帮助您估计true语句的数量 在最后的元素中。

例如,如果流是由服务器日志组成的, DGIM算法可以估计来自搜索引擎的访问比例。 (与直接访问或通过付费搜索访问不同)

安装

在命令行:

$ pip install dgim

用法

示例代码:

from dgim import Dgim
dgim = Dgim(N=32, error_rate=0.1)
for i in range(100):
    dgim.update(True)
dgim_result = dgim.get_count() # 30 (exact result is 32)

许可证

该项目是根据bsd许可证授权的。

作者

如何贡献

  1. 检查打开的问题或打开一个新的问题,开始围绕功能想法或错误的讨论。
  2. 在github上分叉the repository,开始对master分支(或其分支)进行更改。
  3. 编写一个测试,显示错误已修复或功能按预期工作。
  4. 发送一个pull请求并对维护程序进行bug操作,直到它被合并并发布。:)确保将自己添加到AUTHORS

参考文献

历史记录

0.2.0(2015-01-05)

  • 改进的文档
  • 将大多数方法和属性设为私有。

0.1.0(2015-01-04)

  • pypi上的第一个版本。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java将Scanner对象作为构造函数参数传递给UserInterface类   spring未能启动bean“subtocolWebSocketHandler”;嵌套的例外是java。lang.IllegalArgumentException:没有处理程序   Java EE应用程序中后台服务的多线程Java线程(设置守护进程和优先级)?   java Pull to refresh返回列表的第一个位置   无法将comparator类转换为java。可比的   java将json从servlet传递到dojo   JavaHibernate:将子类实例转换为超类实例   java警告调用servlet类时非法反射访问   java静态变量值   java@Entity和@embeddeble之间有什么区别   java将作业配置导入公共作业配置类(注释配置)   sql公共表表达式(以values语句开头)在java中给出错误   java在ImageJ中使用ImageProcessor   java PostgreSQL executeBatch()会随着时间的推移而变慢   java在安卓中以表格形式排列sqllite表数据?   java中SVG的swing定制呈现   java删除与另一个实体映射的实体   java何时/如何添加ListView适配器,使用back按钮恢复它?(片段)   java为什么IBinder和Binder之间的类型转换不是非法的?   java在方法参数列表中使用ArrayList或List