从mixpanel的导出api读取原始事件数据的流库
mixpanel_export的Python项目详细描述
#mixpanel export stream
一个小的python库,用于在利用可流式jsonline数据格式的同时从mixpanel导出和读取原始事件数据。
这个库基于mixpanel自己的数据导出库[在这里](https://mixpanel.com/site_media/api/v2/mixpanel.py)。
mixpanel导出库,只需运行以下命令:
`pip install mixpanel_export`
\
mixpanel的原始事件数据api以json line格式返回数据,这意味着每个事件都是自己行上的一个json对象。
mixpanel警告**不要**尝试读取此数据,直到它以“gzip”格式被全部下载为止,但此压缩类型是可流式的,这意味着这不重要。
与mixpanel自己的python api实现相比,流式处理显著减少了ram中的内存占用,因为您只关心减少over事件。
事件“a”还有一个属性“c”,它是一些随机字符串值。我们希望按“c”对结果进行分组和统计,以查看发生了多少属性“c”事件。
[(a)],'Br/>‘to’日期’:‘…’,‘BR/>‘哪里’:‘Br/> } BR/> } BR/>计数= BR/>< BR/> Def doeCo计数(e):
计数[E[ [属性] ]=1<BR/>< BR/> >允许在期满前请求2分钟(300秒)
秘密)< BR> > BR/> PARAM= {BR/>事件es.请求(params,do_count,expire=300)
打印(“处理的事件总数%s,计数:%s”%(总数,计数))
````
有关“params”参数的更多详细信息,请参阅mixpanel的文档[此处](https://mixpanel.com/docs/api documentation/data export api)。
一个小的python库,用于在利用可流式jsonline数据格式的同时从mixpanel导出和读取原始事件数据。
这个库基于mixpanel自己的数据导出库[在这里](https://mixpanel.com/site_media/api/v2/mixpanel.py)。
mixpanel导出库,只需运行以下命令:
`pip install mixpanel_export`
\
mixpanel的原始事件数据api以json line格式返回数据,这意味着每个事件都是自己行上的一个json对象。
mixpanel警告**不要**尝试读取此数据,直到它以“gzip”格式被全部下载为止,但此压缩类型是可流式的,这意味着这不重要。
与mixpanel自己的python api实现相比,流式处理显著减少了ram中的内存占用,因为您只关心减少over事件。
事件“a”还有一个属性“c”,它是一些随机字符串值。我们希望按“c”对结果进行分组和统计,以查看发生了多少属性“c”事件。
[(a)],'Br/>‘to’日期’:‘…’,‘BR/>‘哪里’:‘Br/> } BR/> } BR/>计数= BR/>< BR/> Def doeCo计数(e):
计数[E[ [属性] ]=1<BR/>< BR/> >允许在期满前请求2分钟(300秒)
秘密)< BR> > BR/> PARAM= {BR/>事件es.请求(params,do_count,expire=300)
打印(“处理的事件总数%s,计数:%s”%(总数,计数))
````
有关“params”参数的更多详细信息,请参阅mixpanel的文档[此处](https://mixpanel.com/docs/api documentation/data export api)。