格里莫雷拉布:统一、事件化和丰富来自Perceval的信息
cereslib的Python项目详细描述
什么是谷神星?
ceres是一个旨在处理一般数据的库,并且 尤其是软件开发数据。
ceres的最初目标是从 中的Perceval工具 GrimoireLab project。
但是,向这个项目添加的代码越多,通用性就越强 方法在其他分析领域也很有用。
以下是ceres可以帮助您进行分析的领域:
事件化
“事件发生器”有助于分离来自perceval的信息。在 简而言之,perceval生成json文档,这些文档可以由 谷神星和图书馆的“事件”边。
通过“事件化”,这意味着解析完整perceval json的过程 用一定数量的 信息。
例如,commit包含关于commit本身的信息, 以及在某个时候被“触碰”的文件。取决于 分析ceres的粒度将按以下方式工作:
- 粒度=1:这是第一级,产生1到1 与原始数据源中主要项的关系。为了 示例1提交将只是结果数据帧中的一行。这个 对于gerrit或 布吉拉买票。
- 粒度=2:这是第二个级别,取决于数据 来源这是多么深入。在特定的提交情况下,这个 将返回数据帧中的n行。会有很多排 作为原始数据源中“接触”的文件。
格式
库的格式部分包含一些实用程序,这些实用程序对于 一些基本的格式化操作,例如在 具有相同字符串格式的Pandas数据帧。
另一个例子是使用format utils从字符串转换 使用datetuils并将该方法应用于 给定数据帧。
过滤器
filter实用程序基本上根据 数据帧的某些单元格。
数据丰富
这是与事件化最相关的实用程序 行动。这将以多种方式添加或修改一个或多个列。
有几个例子,比如照顾代孕妈妈 启用utf8,根据其他操作添加新列, 添加另一列中提供的名称的性别,以及其他。
你在这里能帮忙吗?
这个项目还是很新的,开发很慢,所以 任何额外的手都是非常棒的,甚至可以指点方向,发出碎片 建议或功能请求:)。
当然,使用该软件将是伟大的!
从哪里开始?
examples文件夹包含了一些我曾经使用过的客户机 分析,如性别分析或生成有助于 了解开发人员工作的代码区域。
那可能是个好地方看看。