用于从远程数据馈送设置数据处理管道的库

flexes-feed的Python项目详细描述


弯曲进给

Build Statuscodecov

用于从Web检索和处理定期更新的数据的通用结构

刮刀使用

要创建一个新的scraper,只需创建一个继承自Scraper类的类 重写check()方法。

下面是一个快速的伪示例:

importrequestsfromdata_feed.scraperimportNewFile,ScraperclassMyScraper(Scraper):defcheck(self):response=requests.get(self.channel)# Parse content from page # If the file has changed return a NewFile objectreturn[NewFile(file_url,self.s3_folder)]defrun_scraper():s3_folder='s3://bucket/path/to/store/data'channel='http://somedata.com'scraper=MyScraper(s3_folder,channel)scraper.run()if__name__=='__main__':run_scraper()

请参见examples/noaa_wind_scraper.py以获取实际示例。例子 还要求安装BeautifulSoup4lxml。安装,简单 运行pip install BeautifulSoup4 lxml

订户使用情况

要创建新的订阅服务器,只需创建一个继承自Subscriber的类。 初始化并重写process()方法。

下面是一个快速的psedoo示例:

fromdata_feed.subscriberimportSubscriberclassMySubscriber(Subscriber):defprocess(self,s3_uri):# Process file(s) in s3_uridefsubscribe():channel='http://somedata.com'sub=MySubscriber(channel)sub.subscribe()if__name__=='__main__':subscribe()

有关使用 Lanlytics API。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java ParsePushReceiver参数   java如何从设备读取完整数据?   java将java_设置为home,但忽略错误   java如何从歌曲中对专辑进行排序?   java libnaude+windows 10 x64+Eclipse   java如何将maven目标更改为如图所示的想法中的quickicon?   java swing布局中心面板,可滚动显示多个窗口窗格   使用MOSQUITO代理的mqtt中的java SSL   java如何通过属性值获取XML字符串   java在服务器每次启动时停止GWT编译   java如何让javac搜索类路径的子目录?   可以比较java中的两个不同类吗?   JAVAAndroid活动内部类中的lang.NoClassDefFoundError   java HttpServletRequest获取请求头参数块   C++socket与java客户端的连接   java如何在Apache commons http客户端上使用SSL客户端证书   使用预编译正则表达式模式提高java速度   JavaRhino将两个已编译脚本合并为一个脚本