[ scrapinghub ] 共有 39 个PyPI Python项目:
spidermon
spidermon是一个为爬行蜘蛛构建监视器的框架。 项目维护者: scrapinghub | rennerocha |
scrapy-magicfields
Scrapy中间件为项目添加额外的“魔法”字段 项目维护者: scrapinghub | ScrapyPlugins | scrapy | redapple |
splash
使用http api呈现的javascript 项目维护者: pablohoffman | scrapinghub | scrapy | dangra | kmike |
price-parser
从原始字符串中提取价格和货币 项目维护者: scrapinghub | kmike |
scrapylib
scrapy助手函数和处理器 项目维护者: pablohoffman | scrapinghub | dangra | Pablo | redapple |
hubstorage
客户端界面 项目维护者: pablohoffman | scrapinghub | dangra |
arche
分析零星云数据 项目维护者: scrapinghub | manycoding |
scrapy-querycleaner
清理请求url中查询参数的scrapy spider中间件 项目维护者: scrapinghub | ScrapyPlugins | scrapy | redapple |
PyPyDispatcher
多生产者多用户信号调度机制 项目维护者: scrapinghub | scrapy | lopuhin |
js2xml
将javascript代码转换为xml文档 项目维护者: scrapinghub | redapple |
scrapy-crawlera
scrapy爬网中间件 项目维护者: pablohoffman | rdowinton | scrapinghub | dangra |
exporters
Exporters是一个可扩展的导出管道库,它支持筛选、转换和多个源和目标。 项目维护者: scrapinghub | eljunior |
skinfer
合并json模式的简单工具 项目维护者: scrapinghub | eljunior |
scrapy-po
scrapy的页面对象模式 项目维护者: scrapinghub | scrapy | kmike |
webstruct
用于创建处理HTML数据的统计NER系统的库 项目维护者: pablohoffman | scrapinghub | scrapy | lopuhin | dangra | kmike |
andi
基于注释的依赖注入库 项目维护者: scrapinghub | scrapy | kmike |
scrapinghub
客户界面 项目维护者: scrapinghub | dangra | Pablo |
scrapinghub-entrypoint-scrap
scrapinghub作业运行程序的scrapy入口点 项目维护者: scrapinghub |
shub
scrapinghub命令行客户端 项目维护者: pablohoffman | scrapinghub | dangra |
scrapy-mosquitera
使用匹配器限制爬网和刮除范围。 项目维护者: csalazar | scrapinghub |
scrapy-splitvariants
Scrapy Spider中间件将一个项拆分为多值密钥上的多个项 项目维护者: scrapinghub | ScrapyPlugins | scrapy | redapple |
portia2code
将portia spider定义转换为python scrapy spider 项目维护者: scrapinghub | Ruairi.Fahy |
flatson
通过模式配置的扁平化json类对象流的工具 项目维护者: scrapinghub | dangra | eljunior |
crawl-frontier
一个灵活的网络爬虫前沿 项目维护者: scrapinghub | dangra | gatufo |
scrapy-streamitem
使用streamcorpus流项的scrapy支持 项目维护者: scrapinghub | gatufo |
page_clustering
网页的在线k-means聚类 项目维护者: scrapinghub | plafl |
scrapyrt
在http api后面放置小蜘蛛 项目维护者: scrapinghub | pawelmhm |
scrapy-deltafetch
忽略以前爬网页面的scrapy中间件 项目维护者: scrapinghub | ScrapyPlugins | scrapy | redapple |
adblockparser
adblock plus规则分析器 项目维护者: pablohoffman | scrapinghub | scrapy | lopuhin | dangra | kmike |
wappalyzer-python
用于wappalyzer的python包装器(揭示网站上使用的技术的实用程序) 项目维护者: scrapinghub | gatufo |