蟒蛇记忆中的mapreduce。

tinymr的Python项目详细描述


Spotify’s luigi framework启发的实验性Pythonic MapReduce

https://travis-ci.org/geowurster/tinymr.svg?branch=masterhttps://coveralls.io/repos/geowurster/tinymr/badge.svg?branch=master

典型字数示例

目前有两个MapReduce实现,一个包括排序和 没有的人下面的示例不会从排序中受益,因此我们可以 利用不排序的固有优化。API是相同的 但是tinymr.memory.MRSerial()在分区之后以及在 reducer()final_reducer()

importjsonimportreimportsysfromtinymr.memoryimportMRSerialclassWordCount(MRSerial):def__init__(self):self.pattern=re.compile('[\W_]+')defmapper(self,item):forwordinitem.split():word=self.pattern.sub('',word)ifword:yieldword.lower(),1defreducer(self,key,values):yieldkey,sum(values)deffinal_reducer(self,pairs):return{k:tuple(v)[0]fork,vinpairs}wc=WordCount()withopen('LICENSE.txt')asf:out=wc(f)print(json.dumps(out,indent=4,sort_keys=True))

截断输出:

{"a":1,"above":2,"advised":1,"all":1,"and":8,"andor":1}

开发

$ git clone https://github.com/geowurster/tinymr.git
$cd tinymr
$ pip install -e .\[dev\]$ py.test tests --cov tinymr --cov-report term-missing

许可证

LICENSE.txt

变更日志

CHANGES.md

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在通配符泛型类型和泛型类型之间未经检查的强制转换   java Eclipse SWT Hello world教程:无法将显示解析为类型   java如何向远程用户发送注销消息?   java RDD之后的空文件是什么。保存ASTEXTFILE?   用户界面在java中创建一个htmljs UI GCalendar   Java多个哈希映射指向同一个键   Java Dowhile循环不工作?   oraclejava类。组织。阿帕奇。梁sdk。util。UserCodeException:java。sql。SQLException:无法创建PoolableConnectionFactory   java是org类型。日食用户界面。文本编辑器。*看不见   java有没有从弹出窗口复制eclipse中变量值的插件或快捷方式?   java getSubimage为我提供了期望值null   java我想让它变得更简单   swing AWTEventQueue0一直在运行,java中的程序变得非常慢   java Solr实例化类时出错:自定义类   java将ListView适配器移植到RecyclerView适配器   c#测试混合web和桌面应用程序的安全性