实验内存数据流管道。

tinyflow的Python项目详细描述


数据流编程实验。

https://travis-ci.org/geowurster/tinyflow.svg?branch=masterhttps://coveralls.io/repos/geowurster/tinyflow/badge.svg?branch=master

经过一些实验,apache beam的python sdk得到了正确的api。 用这个代替。

标准字数示例

LICENSE.txt

中获取5个最常用的单词
fromcollectionsimportCounterfromtinyflow.serialimportops,Pipelinepipe=Pipeline() \
    |"Split line into words">>ops.flatmap(lambdax:x.lower().split()) \
    |"Remove empty lines">>ops.filter(bool) \
    |"Produce the 5 most common words">>ops.counter(5) \
    |"Sort by frequency desc">>ops.sort(key=lambdax:x[1],reverse=True)withopen('LICENSE.txt')asf:results=dict(pipe(f))

仅使用python的内置项:

fromcollectionsimportCounterimportitertoolsasitwithopen('LICENSE.txt')asf:lines=(line.lower().split()forlineinf)words=it.chain.from_iterable(lines)count=Counter(words)results=dict(count.most_common(10))

开发

$ git clone https://github.com/geowurster/tinyflow.git
$cd tinyflow
$ pip install -e .\[all\]$ pytest --cov tinyflow --cov-report term-missing

许可证

LICENSE.txt

更改日志

CHANGES.md

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用jaxrpc的Java eclipse WebService客户端   java编程方式在对象上写入名称   java Spring批处理:重试后跳过   java Android错误:错误:任务执行失败:应用程序:transformClassesWithDexForDebug'   带有清单文件nullPointerException的java Android元数据   spring Java Quartz调度作业停止运行   JavaMockito:如何在不调用实际方法的情况下,模拟带有参数和无效返回类型的静态方法?   java Tomcat连接池问题无法在关闭的连接上调用方法   java如何交换列表中的项目?   java如何停止线程并通过Toast在线程中正确显示文本?   java为什么连续写入OutputStream时偏移量0不会导致重复字节?   java我无法生成头文件   不兼容的返回类型错误java   修改值后键值对的java Jolt转换规范   java有自动更新Javadoc的工具吗?   java线程如何在ints自身实例类中共享变量   java继承一个非gwt模块   java Hibernate xml配置   使用netty4异步调用的java链接HTTP请求响应