datalad扩展包,用于将外部web资源爬行到自动数据分发中

datalad_crawler的Python项目详细描述


 ____          _           _                 _
|  _ \   __ _ | |_   __ _ | |      __ _   __| |
| | | | / _` || __| / _` || |     / _` | / _` |
| |_| || (_| || |_ | (_| || |___ | (_| || (_| |
|____/  \__,_| \__| \__,_||_____| \__,_| \__,_|
                                   Crawler

Travis tests statuscodecov.ioDocumentationLicense: MITGitHub releasePyPI version fury.ioAverage time to resolve an issuePercentage of issues still open

此扩展增强了用于爬网的datalad(http://datalad.org) 将外部Web资源转换为自动化的数据分发。请看 a的extension documentation 其他命令和功能的说明。

有关如何使用或贡献datalad的一般信息(以及 分机),请参见DataLad website或 这是main GitHub project page

安装

在安装此软件包之前,请确保install a recent version of git-annex。之后, 从安装最新版本的datalad-crawlerPyPi。建议 使用专用的virtualenv

# create and enter a new virtual environment (optional)
virtualenv --system-site-packages --python=python3 ~/env/datalad
. ~/env/datalad/bin/activate

# install from PyPi
pip install datalad_crawler

支架

本项目的文件如下: http://docs.datalad.org/projects/crawler

此软件的所有错误、问题和增强请求可以是 此处提交:https://github.com/datalad/datalad-crawler/issues

如果你有问题或者想问一个关于如何使用的问题 datalad,请用 datalad标记。neurostars.org是一个类似stackoverflow的平台 但致力于神经信息学。

所有先前的datalad问题都可以在这里找到: http://neurostars.org/tags/datalad/

致谢

datalad的开发得到了美德在 计算神经科学项目 将目录、仓库和部署后勤集成到联邦数据中 “发行”(Halchenko/Hanke),由美国国家科学基金会共同资助 基金会(NSF 1429999)和德国联邦教育部 以及研究(BMBF 01GQ1411)。额外的支持由 德国联邦萨克森州和欧洲地区 发展基金(ERDF),项目:行为脑科学中心, 成像平台。这项工作由重新修订进一步促进。 项目(NIH 1P41EB019936-01A1)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript如何在jQuery函数中传递两个值,该函数获取数据并使用ajax发送到服务器?   java IOSDriver()不工作。相反,当我在测试用例通过时使用RemoteWebDriver()时,它正在打开远程会话   使用java对blob几何体进行二进制解码   java错误:Gradle:运行在Ubuntu 16.04上的Intellij 2017中的任务执行失败   java Lotus Notes邮件文档获取附件名称(和导出附件)   java如果库有副作用,这样可以吗?   java Javabat帮助:alarmClock   加载类时未初始化java静态变量   java限制htmlunit中的带宽   java Column_layout在安卓 tablelayout中不起作用   java在倒计时和打印循环时遇到问题   虚拟机我需要一个如何访问java虚拟机中的文件的帮助   java图像处理程序中的多线程