从mixpanel的导出api读取原始事件数据的流库

mixpanel_export的Python项目详细描述


#mixpanel export stream
一个小的python库,用于在利用可流式jsonline数据格式的同时从mixpanel导出和读取原始事件数据。

这个库基于mixpanel自己的数据导出库[在这里](https://mixpanel.com/site_media/api/v2/mixpanel.py)。

mixpanel导出库,只需运行以下命令:

`pip install mixpanel_export`

\

mixpanel的原始事件数据api以json line格式返回数据,这意味着每个事件都是自己行上的一个json对象。

mixpanel警告**不要**尝试读取此数据,直到它以“gzip”格式被全部下载为止,但此压缩类型是可流式的,这意味着这不重要。

与mixpanel自己的python api实现相比,流式处理显著减少了ram中的内存占用,因为您只关心减少over事件。

事件“a”还有一个属性“c”,它是一些随机字符串值。我们希望按“c”对结果进行分组和统计,以查看发生了多少属性“c”事件。

[(a)],'Br/>‘to’日期’:‘…’,‘BR/>‘哪里’:‘Br/> } BR/> } BR/>计数= BR/>< BR/> Def doeCo计数(e):
计数[E[ [属性] ]=1<BR/>< BR/> >允许在期满前请求2分钟(300秒)
秘密)< BR> > BR/> PARAM= {BR/>事件es.请求(params,do_count,expire=300)
打印(“处理的事件总数%s,计数:%s”%(总数,计数))
````

有关“params”参数的更多详细信息,请参阅mixpanel的文档[此处](https://mixpanel.com/docs/api documentation/data export api)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
带有字符串的java JNA调用与带有字节[]的java JNA调用的行为不同   java基于键列表获取子映射   重启后永久增加java堆大小?   JavaHTTPS服务器:相互SSL身份验证   java为什么接受接口的方法会拒绝该接口的实现?   片段中的java视图无法应用于()   ms access Java SQL更新命令不工作   java将web服务自动打包和部署到Oracle Application Server 10g   java有没有办法在安卓 studio中为安卓时钟设置多个警报?   位于FTP服务器上的文件上的Java校验和md5   在Java中创建类时遇到问题。有些方法不太确定   java错误:在类chrome\u驱动程序中找不到主方法   通用海图(Javascript\Java)