一组命令行工具,有助于获取、清理和探索数据。

datalog的Python项目详细描述


#数据学

[![生成状态](https://secure.travis-ci.org/michaeljoseph/datalogy.png)](http://travis-ci.org/michaeljoseph/datalogy) [![故事就绪](https://badge.waffle.io/michaeljoseph/datalogy.png?label=ready)](https://waffle.io/michaeljoseph/datalogy) [![PYPI版本](https://badge.fury.io/py/datalogy.png)](http://badge.fury.io/py/datalogy) [![下载次数](https://pypip.in/d/datalogy/badge.png)](https://crate.io/packages/datalogy?version=latest) [![代码覆盖率](https://coveralls.io/repos/michaeljoseph/datalogy/badge.png?branch=master)](https://coveralls.io/r/michaeljoseph/datalogy?分支=主)

啊![数据学](https://github.com/michaeljoseph/datalogy/raw/master/resources/datalogy.jpg

一组python工具,它们有助于获取、清理 以及探索数据。

##刮擦

使用xpath查询或css3选择器提取html元素。

###示例用法

curl -s http://en.wikipedia.org/wiki/List_of_sovereign_states |
scrape -be ‘table.wikitable > tr > td > b > a’

##随机抽样

给定概率下从stdin到stdout的输出线 持续时间,以及线路之间的给定延迟。

###示例用法

seq 100 | random-sample -r 20% -d 1000

##测试

安装开发要求:

pip install -r requirements.txt

使用以下命令运行测试:

nosetests

在项目中添加:

flake8 datalogy tests

##API文档

生成文档:

cd docs && PYTHONPATH=.. make singlehtml

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
graph Java自己生成类图   java MouseMotionListener:鼠标和触控板给出不同的结果   java解析清单条目的正确方法是什么。jar中的mf文件?   java如何创建带有半透明色块的透明gif/png图像?   java应用内计费V3:跨设备同步购买   java Spring数据JPA注入失败BeanCreationException:无法自动连接字段   Java数据结构维护插入顺序和重复值   java无法在VSCode中设置JavaFX   java中数据字段初始化的类顺序   java如何使用ClientBuilder为Rest Post Api多部分编写集成测试   JUnit测试divide()方法的java正确方法   java将消息标记为接收前已读   Java ArrayList调用扩展对象函数   java Android:只使用GCM的TCP/IPServer   Java如何将xls数据转换为txt文件   编译为Jar文件后未找到java类   java返回子字符串的所有匹配项   java Get json用户_timeline api twitter 1.1