格里莫雷拉布:统一、事件化和丰富来自Perceval的信息

cereslib的Python项目详细描述


什么是谷神星?

ceres是一个旨在处理一般数据的库,并且 尤其是软件开发数据。

ceres的最初目标是从 中的Perceval工具 GrimoireLab project

但是,向这个项目添加的代码越多,通用性就越强 方法在其他分析领域也很有用。

以下是ceres可以帮助您进行分析的领域:

事件化

“事件发生器”有助于分离来自perceval的信息。在 简而言之,perceval生成json文档,这些文档可以由 谷神星和图书馆的“事件”边。

通过“事件化”,这意味着解析完整perceval json的过程 用一定数量的 信息。

例如,commit包含关于commit本身的信息, 以及在某个时候被“触碰”的文件。取决于 分析ceres的粒度将按以下方式工作:

  • 粒度=1:这是第一级,产生1到1 与原始数据源中主要项的关系。为了 示例1提交将只是结果数据帧中的一行。这个 对于gerrit或 布吉拉买票。
  • 粒度=2:这是第二个级别,取决于数据 来源这是多么深入。在特定的提交情况下,这个 将返回数据帧中的n行。会有很多排 作为原始数据源中“接触”的文件。

格式

库的格式部分包含一些实用程序,这些实用程序对于 一些基本的格式化操作,例如在 具有相同字符串格式的Pandas数据帧。

另一个例子是使用format utils从字符串转换 使用datetuils并将该方法应用于 给定数据帧。

过滤器

filter实用程序基本上根据 数据帧的某些单元格。

数据丰富

这是与事件化最相关的实用程序 行动。这将以多种方式添加或修改一个或多个列。

有几个例子,比如照顾代孕妈妈 启用utf8,根据其他操作添加新列, 添加另一列中提供的名称的性别,以及其他。

你在这里能帮忙吗?

这个项目还是很新的,开发很慢,所以 任何额外的手都是非常棒的,甚至可以指点方向,发出碎片 建议或功能请求:)。

当然,使用该软件将是伟大的!

从哪里开始?

examples文件夹包含了一些我曾经使用过的客户机 分析,如性别分析或生成有助于 了解开发人员工作的代码区域。

那可能是个好地方看看。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
安卓中通过TCP发送时java文件损坏   Java测试预期=异常失败,断言错误   java ssh4 LazyInitializationException   java是否可以在集合中添加重复项?   java是一个免费的开源数据库管理工具   java是否可以在导出的html中嵌入图像   编译器构造解释一些东西,并用Java运行生成的字节码?   java KeyPairGenerator未生成随机密钥   java使用正则表达式生成字符串而不是匹配字符串   java中的多线程线程间通信   具有复合密钥的java Hibernate合并问题   java不能在MainActivity类之外使用SharedReferences变量   正在获取切割/零件异常消息。使用java Spring ControllerAdvice   java tomcat漏洞讨论   javascript在Java中实现“system”命令   java如何在JUnit5*中加载*Spring测试上下文之前获取回调?   java bluej关于缺少返回语句   JavaSpringBoot@ModelAttribute包含使用字符串键的其他模型   从可选中抛出异常。ifPresent()Java 8