数据科学用unix管件

smalldata的Python项目详细描述


用于统计的Unix管件

在寻找command line data science的过程中, 此工具包包含三个用于unix管道的命令行实用程序。

如果没有参数运行,所有三个进程stdin到stdout都输出其docstring。

python 3是必需的。

sd_c(小数据计数)

是正则表达式计数器筛选器,包含在smalldata/counter.py中。请参阅docstring以获取进一步帮助。

sd_g(smalldata groupby)

连接stdin中与smalldata/groupby.py中包含的正则表达式匹配的行。请参阅docstring。

sd_e(小数据提取)

本着RegExSerDe的精神,这个 该工具使用正则表达式从自由格式文本文件生成csv文件。它包含在smalldata/extract.py中并具有docstring。

其他有用的工具

如果你有csv文件,你应该最终签出q

待办事项

一本食谱就好了。演示如何分析日志文件等。

历史记录

曾经生活在一个要点中:https://gist.github.com/martinvirtel/94cf47f64bf304e1c66598e93cd565c4

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Eclipse内存分析器(MAT):不显示当前正在运行的进程   java Apache Velocity:转义字符不能作为关联数组键用于PHP   不截断零的java格式十进制输出   在另一个类文件中调用时返回空值的java getter   java集合获取连接   java解析json使用Gson登录系统应用程序强制关闭   java DelferredResult带有两个请求的ajax请求   java可降低功耗,同时应使用无线   java BoxLayout无法共享错误?   java如何使用计时器制作闹钟   java使用OAuth2保护RESTWeb服务:一般原则   java在一个jframe上显示多个图像和按钮