Python labours包_程序模块 - PyPI

python companion for github.com/src-d/hercules以可视化结果。

labours的Python项目详细描述

大力神
快速、深入和高度可定制的Git历史分析。

/a>
概述• 如何使用。安装. 贡献•。许可证

概述
安装
- 从源代码构建
贡献
许可证
用法
- 缓存
- docker图像
- 内置分析
  - 项目耗竭
  - 文件
  - 人
  - 流失矩阵
  - 代码所有权
  - 情侣
  - 结构热
  - 对齐提交序列
  - 随时间添加vs更改的行
  - 努力通过时间
  - 情绪（正面和负面评论）
  - 单程中的所有内容
- 插件
- 合并
- 错误的Unicode错误
- 打印
- 自定义打印后端
- 注意事项
- 内存耗尽

概述

Hercules是一个用Go编写的快速且高度可定制的Git存储库分析引擎。包括电池。由go-git和babelfish提供支持

有两种命令行工具：hercules和labours。首先是一个程序使用go编写，它接受git存储库，并在完整的提交历史记录中执行分析任务的定向非循环图（dag）。第二个是python脚本，它在收集的数据上显示一些预定义的图。这两种工具通常通过管子可以使用插件系统编写自定义分析。也有可能合并多个分析结果-与组织相关。分析的提交历史包括分支、合并等。

Hercules已经成功地用于source{d}的几个内部项目。有一些博客文章：1，2和 a演示文稿。请贡献通过测试、修复错误、添加新分析，或编码狂妄！

hercules dag of burndown analysis

燃耗和耦合分析与uast diff精炼的dag。由hercules--burndown--burndown people--couples--feature=uast--dry run--dump dag doc/dag.dot https://github.com/src-d/hercules生成

Torvalds/Linux线路烧毁（粒度30，采样30，按年份重新采样）。用hercules--burndown--first parent--pb https://github.com/torvalds/linux labours-f pb-m burndown project在1小时40分钟内生成。

`安装`

从发布页面获取二进制文件。 labours可从pypi安装：：

pip3 install labours

pip3是python包管理器。

可以使用http://www.lfd.uci.edu/%7egohlke/pythonlibs/" rel="nofollow">http://www.lfd.uci.edu/~gohlke/pythonlibs/

在Windows上安装Numpy和Scipy
从源代码生成
你要走了ng需要go（>；=v1.10），protoc，
以及dep
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
在Windows上将$gopath替换为%gopath%。
贡献
…欢迎！参见贡献和行为准则
许可证
Apache2.0
用法
最有用、最可靠的最新命令行参考：
hercules --help
一些示例：
# Use "memory" go-git backend and display the burndown plot. "memory" is the fastest but the repository's git data must fit into RAM.
hercules --burndown https://github.com/src-d/go-git | labours -m burndown-project --resample month
# Use "file system" go-git backend and print some basic information about the repository.
hercules /path/to/cloned/go-git
# Use "file system" go-git backend, cache the cloned repository to /tmp/repo-cache, use Protocol Buffers and display the burndown plot without resampling.
hercules --burndown --pb https://github.com/git/git /tmp/repo-cache | labours -m burndown-project -f pb --resample raw

# Now something fun
# Get the linear history from git rev-list, reverse it
# Pipe to hercules, produce burndown snapshots for every 30 days grouped by 30 days
# Save the raw data to cache.yaml, so that later is possible to labours -i cache.yaml
# Pipe the raw data to labours, set text font size to 16pt, use Agg matplotlib backend and save the plot to output.png
git rev-list HEAD | tac | hercules --commits - --burndown https://github.com/git/git | tee cache.yaml | labours -m burndown-project --font-size 16 --backend Agg --output git.png
labours-i/path/to/yaml允许读取保存在磁盘上的hercules的输出。
缓存
可以将克隆的存储库存储在磁盘上。后续分析可以在
相应的目录而不是从头开始克隆：
# First time - cache
hercules https://github.com/git/git /tmp/repo-cache

# Second time - use the cache
hercules --some-analysis /tmp/repo-cache
Docker图像
docker run --rm srcd/hercules hercules --burndown --pb https://github.com/git/git | docker run --rm -i -v $(pwd):/io srcd/hercules labours -f pb -m burndown-project -o /io/git_git.png
内置分析
项目耗竭
hercules --burndown
labours -m burndown-project
整个存储库的行消耗统计信息。
与特修斯的git完全相同
但速度要快得多。通过使用自定义rb树跟踪，可以高效、增量地执行责备。
算法，运行分析时只记录最后修改日期。
所有燃耗分析都取决于粒度和采样的值。
粒度是堆栈中每个频带包含的天数。抽样
是捕捉耗尽状态的频率。越小的
值，绘图越平滑，但完成的工作越多。
有一个选项可以对labours中的频带重新采样，这样您就可以
定义一个非常精确的分布并以不同的方式将其可视化。此外，
重新采样跨周期边界（例如，月或年）对齐波段。
未限制的波段显然没有对齐，并且从项目的出生日期开始。
文件
hercules --burndown --burndown-files
labours -m burndown-file
存储库中最新版本中活动的每个文件的消耗统计信息。
注意：它将为每个文件生成单独的图形。您不想在包含许多文件的存储库上运行它。
人
hercules --burndown --burndown-people [--people-dict=/path/to/identities]
labours -m burndown-person
存储库贡献者的耗尽统计信息。如果未指定--people dict，则标识为
通过以下算法发现：
我们从根开始向头承诺。电子邮件和姓名将转换为小写。
如果我们处理未知的电子邮件和姓名，请将其作为新的开发人员记录。
如果我们处理一封已知但未知的电子邮件，请使用匹配的电子邮件与开发人员匹配，
并将未知名称添加到开发人员的名称列表中。
如果我们处理的是未知的电子邮件，但名称已知，请使用匹配的名称与开发人员匹配，
并将未知电子邮件添加到该开发人员的电子邮件列表中。
< > >如果指定了--people dict，则应指向具有自定义标识的文本文件。这个
格式是：每一行都是一个开发人员，它包含所有匹配的电子邮件和分隔的名称
通过。忽略案例。覆盖矩阵
Wireshark 20强开发者-覆盖矩阵
pip3 install labours
0
除了燃尽信息之外，燃尽人员根据
开发商。因此，可以直观地看到开发人员a写的行被开发人员b删除了多少行。
这表示人员之间的协作，并定义专业团队。
格式是包含n行和（n+2）列的矩阵，其中n是开发人员的数量。第一列是开发人员编写的行数。
第二列是开发人员编写了多少行代码，而未经身份验证的开发人员删除了多少行代码
（如果未指定"people dict"，则始终为0）。
其余的列显示开发人员编写了多少行，并通过标识删除了多少行
开发人员。
< > >开发人员的序列存储在people\u sequenceyaml节点中。
代码所有权
ember.js前20名开发人员-代码所有权
pip3 install labours
1
--burndown people还允许通过时间叠加面积图绘制代码共享。也就是说，
对于每个确定的显影剂，在采样时刻有多少行是活动的。
对
Tensorflow投影仪中的Torvalds/Linux文件耦合
pip3 install labours
2
重要信息：需要安装TensorFlow，请遵循官方说明
如果在同一提交中更改了这些文件，则它们是耦合的。如果开发人员
更改同一文件。hercules记录整个提交历史中的对数
并输出两个对应的共生矩阵。劳动然后训练
旋转嵌入-反映
通过欧氏距离的共现概率。训练需要一个
安装。中间文件存储在
系统临时目录或--如果指定，则耦合tmp dir。经过训练的嵌入是
写入当前工作目录，其名称取决于-o。输出格式为tsv
并与tensorflow projector匹配
可以在tf投影仪中实现t-sne的可视化。
结构热度
pip3 install labours
3
多亏了巴贝菲什，赫拉克勒斯能够测量每个结构单元被修改了多少次。
默认情况下，它查看函数；请参阅语义uast xpath
手动切换到其他位置。
pip3 install labours
4
如果可用，耦合分析会自动加载"快照"数据。
赫拉克勒斯——肖特内斯——PB https://github.com/pallets/jinja劳工——M对夫妇——F PB
对齐提交序列
tensorflow/tensorflow-aligned commit系列，按commit编号排列，由前50名开发人员组成。
pip3 install labours
5
我们记录每个开发人员每天进行的提交以及添加、删除和更改的行数。
我们使用一些技巧来绘制结果提交时间序列，以显示时间分组。换句话说，
正常化后，两个相邻的提交序列应该看起来相似。我们计算了提交序列的距离矩阵。我们的距离指标是
动态时间扭曲。
我们使用fastdtw具有线性复杂性的算法
与时间序列的长度成正比。因此，计算矩阵的总体复杂性是二次的。
我们用
系列化技术。
特别是，我们解决了旅行推销员问题，这是np完全问题。
然而，考虑到开发人员的典型数量少于1000人，很有可能
解决方法不需要太多时间。我们使用谷歌或工具来解决问题。
我们在生成的路径中找到一维集群，其中包含hdbscan
算法并相应地分配颜色。
时间序列通过与Slepian窗口的卷积来平滑
< > >这个图可以发现开发团队是如何随着时间而发展的。它还显示了"提交flashmobs"
例如，hacktoberfest。例如，下面是
从上面的tensorflow/tensorflowplot获得的见解："Tensorflow Gardener"是唯一的异常值。
"蓝色"的开发人员包括全球维护人员和一些离开的人（在顶部）。
"红色"组显示核心开发人员如何加入项目或变得不那么活跃。
< > >随时间增加与更改的行数
tensorflow/tensorflow随着时间的推移添加和更改行。
pip3 install labours
6
--devs上一节允许绘制添加了多少行以及现有更改了多少行
（删除或替换）通过时间。此绘图已平滑。
通过时间的努力
kubernetes/kubernetes通过时间的努力。
pip3 install labours
7
此外，--devs允许绘制每个开发人员更改（添加或删除）的行数。
地块的上部是一个累积（综合）的下部。不可能有同样的规模
对于这两部分，将缩放较低的值，因此没有较低的Y轴刻度。
努力图和所有权图之间有区别，尽管变化的线与
拥有自己的线路。
情绪（正面和负面评论）
可以清楚地看到，django的评论一开始是积极/乐观的，但后来变成消极/悲观的。
赫拉克勒斯——情绪——pb https://github.com/django/django labours-m情绪——f pb我们在每次提交时从源代码中提取新的和更改的注释，应用bidisentition
通用情绪递归神经网络并绘制结果。要求
libtensorflow。
例如，很遗憾，我们需要从文档查找器f中隐藏rect或者现在是负数
Theano有一个内置的logsumexp（…）优化，因此我们可以直接编写表达式
是积极的。但是不要期望太高-正如所写的，情绪模型是
一般用途和代码注释具有不同的性质，因此暂时没有魔力。
Hercules必须用"TensorFlow"标记构建-默认情况下不是这样：
pip3 install labours
8
这样的构建需要libtensorflow
一次完成所有操作
pip3 install labours
9
插件
Hercules有一个插件系统，允许运行自定义分析。请参见plugins.md。
合并
hercules combine是将多个分析结果以协议缓冲区格式连接在一起的命令。
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
0
错误的Unicode错误
yaml不支持unicode字符的整个范围，也不支持labours侧的解析器
可能引发异常。从hercules到fix-yaml\u unicode.py的输出进行筛选以丢弃
这些令人讨厌的角色。
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
1
绘图
这些选项影响所有绘图：
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
2
--style设置绘图的常规样式（请参见labours--help）。
--背景将绘图背景更改为白色或黑色。
--backend选择matplotlib后端。
--size以英寸为单位设置图形的大小。默认值为12,9
（在MacOS中是必需的）您可以用
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
3
这些选项仅在燃尽图表中有效：
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
4
--text size更改字体大小，--relative激活拉伸的burndown布局。
自定义打印后端可以输出以json格式绘制图所需的所有信息。
只需将.json附加到输出（-o）即可。数据格式不完整
指定并依赖于生成它的python代码。每个json文件都应该
包含反映绘图类型的"type"。
注意事项
在某些罕见的情况下，处理所有提交可能会失败。如果出现类似于https://github.com/src-d/hercules/issues/106" rel="nofollow">https://github.com/src-d/hercules/issues/106的错误
请在此处报告并指定--第一个父级作为解决方法。
耗尽收集可能会失败，并出现内存不足错误。有关解决方法，请参见下一节课。
当内部对象的数量很大时，在python中解析yaml很慢。hercules'输出
对于处于"耦合"模式的Linux内核来说，是1.5GB，需要一个多小时/180GB的RAM
解析。然而，大多数存储库在一分钟内就被解析了。尝试使用协议缓冲区
相反（hercules--pb和labours-f pb）。
加速yaml解析
go get -d gopkg.in/src-d/hercules.v10/cmd/hercules
cd $GOPATH/src/gopkg.in/src-d/hercules.v10
make
pip3 install -e ./python
5
< > >内存耗尽
如果分析的存储库很大并且广泛使用分支，那么burndown stats集合可以
一声"呜呜"就失败了。您应该尝试以下操作：
从磁盘读取repo，而不是克隆到内存。
使用--skip blacklist避免分析不需要的文件。也可以限制--language
使用休眠功能：休眠距离10——烧毁休眠阈值=1000。播放这两个数字，以便在OOM前开始休眠。
在磁盘上休眠：--burndown hibernation disk--burndown hibernation dir/path
--第一父级，你赢了。
< > >标签：
src
github
com
for
开发人员
可视化
companion
burndown
hercules
欢迎加入QQ群-->： 979659372
                                    
推荐PyPI第三方库
xyz-auth
验证公用api
wafec.oslo.messaging
奥斯陆消息传递API
mimcvdf
使用MiMC的通用高电平VDF
MeetShah
高斯分布
udsnd-distributions
高斯分布和二项式分布
ranking-metrics-torch
用PyTorch实现的通用排名指标
nornir-tests
Nornir测试扩展
BGdistributions
高斯分布
himawari8
协助从日本himawari 8号卫星下载地球图像
geoedfframework
GeoEDF连接器处理器框架
libfsntfspython
防止攻击的包
palki-101703381-missing-data
缺少数据句柄
supra-dist
高斯分布和二项式分布
zizu-first-package
高斯分布
amulet-core
一个Python库，用于读/写Minecraft的各种存储格式。

导航栏项目描述版本历史下载文件项目链接首页标签许可证: BSD许可证（BSD 3条款）作者信息:: 暂无维护者 srcd 最新PyPI项目 italian_vip_says UFx vofs fake_item_generator NerEva django-monologue fio_product_attribute_strict climailsystem pyshape tbb-devel npy-append-arra anthill.tal.macrorenderer odoo11-addon-stock-a uuuu contextil fyl_nester appomatic_renderable teacher chuletas slackbot_ce 最新Python常见问题如何重塑数组、迭代列的所有行并将重塑后的数组分配给新列？Python/Pandas/Numpy 如何重塑数组的形状？如何重塑文本数据以适应keras的LSTM模型如何重塑未对齐的数据集，并使用numpy丢弃剩余数据？如何重塑此数据以使用绘图如何重塑此数据帧？如何重塑此数据集以适应RNN 如何重塑没有列的数组？如何重塑测试数据帧，使其维数与训练和预测工作中使用的维数相同？如何重塑系列以在StandardScaler中使用它如何重塑线性回归的数据如何重塑线性回归的数据？如何重塑表格？如何重塑要堆叠的重复宽数据帧？如何重塑输入以放入二维层？

labours 10.3.0

labours的Python项目详细描述

大力神 快速、深入和高度可定制的Git历史分析。/a>概述• 如何使用。 安装. 贡献•。 许可证

目录

概述

安装

从源代码生成

贡献

许可证

用法

缓存

Docker图像

内置分析

项目耗竭

文件

人

代码所有权 ember.js前20名开发人员-代码所有权pip3 install labours 1 --burndown people还允许通过时间叠加面积图绘制代码共享。也就是说， 对于每个确定的显影剂，在采样时刻有多少行是活动的。

对齐提交序列

随时间增加与更改的行数 tensorflow/tensorflow随着时间的推移添加和更改行。pip3 install labours 6 --devs上一节允许绘制添加了多少行以及现有更改了多少行 （删除或替换）通过时间。此绘图已平滑。

情绪（正面和负面评论）

一次完成所有操作 pip3 install labours 9

插件

合并

错误的Unicode错误

绘图

自定义打印后端

注意事项

内存耗尽

推荐PyPI第三方库

xyz-auth

wafec.oslo.messaging

mimcvdf

MeetShah

udsnd-distributions

ranking-metrics-torch

nornir-tests

BGdistributions

himawari8

geoedfframework

libfsntfspython

palki-101703381-missing-data

supra-dist

zizu-first-package

amulet-core

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

大力神
快速、深入和高度可定制的Git历史分析。

/a>
概述• 如何使用。安装. 贡献•。许可证

`安装`

`缓存`

`Docker图像`

`内置分析`

`项目耗竭`

`文件`

`人`

代码所有权
ember.js前20名开发人员-代码所有权
`pip3 install labours`
1
`--burndown people`还允许通过时间叠加面积图绘制代码共享。也就是说，对于每个确定的显影剂，在采样时刻有多少行是活动的。

随时间增加与更改的行数
tensorflow/tensorflow随着时间的推移添加和更改行。
`pip3 install labours`
6
`--devs`上一节允许绘制添加了多少行以及现有更改了多少行（删除或替换）通过时间。此绘图已平滑。

一次完成所有操作
`pip3 install labours`
9

导航栏

项目链接

标签