用于任何数据源的基于python的scraper。

pyetl-framework的Python项目详细描述


#pyetl框架
用于构建和运行etl管道的基于烧瓶的框架

创建一个新的python项目,然后“pip install pyetl framework”。

要运行app flask应用程序前端:`pyetl flask`
要运行工作进程:`pyetl flask worker`

app_basedir=$(pwd)必须指向包含配置文件的目录。还需要配置文件。请参见“config.py.example”。

` pipe.start()`应该执行任何必要的操作,确定并将必须执行的任何和所有“etljob”排队,以便认为运行成功。


\etljob
框架中定义的基类。它有三种方法:提取、转换、加载。

etljob将在执行时运行{transformer extractor loader}.execute()'。

要开始使用,请点击[此处](https://realpython.com/blog/python/flask-by-example-part-1-project-setup)。


once


then:`pip install-r requirements.txt`

这不应该在这里。
git remote add heroku staging git@heroku.com:pyscrap staging.git
git remote add heroku production git@heroku.com:pyscrap production.git

`make deploy`

release
首先,创建一个新的pip包。这将碰撞修补程序版本并将其写入“version”。
“make package”

然后,将包推送到存储库:
“make release”`

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Spring 4升级后未加载java应用程序上下文   java Android 2.3.3 internet可以在我的Galaxy S上运行,但不能在我的Galaxy选项卡上运行?(许可?)   java通过不改变其原始位置对大小写字母进行排序   java Spring Boot一直在破坏我的电脑。。。sts的最佳配置是什么。Windows 10上的ini文件?   css Java Spring+引导问题   java Jackson将GeoJsonPoint序列化为纬度/经度   xml Java Transformer:如何将其结果生成OutputStream?   java如何更改字体、文本大小和设置文本位置?   在JavaSpringHibernate3.6.3中,如何告诉一个方法等待,直到获得锁,以及如何重试失败的事务?   java安卓服务代替线程   Java Swing使用鼠标移动JFrame