Python tinymr包_程序模块 - PyPI

蟒蛇记忆中的mapreduce。

tinymr的Python项目详细描述

受Spotify’s luigi framework启发的实验性Pythonic MapReduce

https://travis-ci.org/geowurster/tinymr.svg?branch=master

https://coveralls.io/repos/geowurster/tinymr/badge.svg?branch=master

典型字数示例

目前有两个MapReduce实现，一个包括排序和没有的人下面的示例不会从排序中受益，因此我们可以利用不排序的固有优化。API是相同的但是tinymr.memory.MRSerial()在分区之后以及在 reducer()和final_reducer()

importjsonimportreimportsysfromtinymr.memoryimportMRSerialclassWordCount(MRSerial):def__init__(self):self.pattern=re.compile('[\W_]+')defmapper(self,item):forwordinitem.split():word=self.pattern.sub('',word)ifword:yieldword.lower(),1defreducer(self,key,values):yieldkey,sum(values)deffinal_reducer(self,pairs):return{k:tuple(v)[0]fork,vinpairs}wc=WordCount()withopen('LICENSE.txt')asf:out=wc(f)print(json.dumps(out,indent=4,sort_keys=True))

截断输出：

{"a":1,"above":2,"advised":1,"all":1,"and":8,"andor":1}

开发

$ git clone https://github.com/geowurster/tinymr.git
$cd tinymr
$ pip install -e .\[dev\]$ py.test tests --cov tinymr --cov-report term-missing

许可证

见LICENSE.txt

变更日志

见CHANGES.md

欢迎加入QQ群-->： 979659372

tinymr 0.1

tinymr的Python项目详细描述

典型字数示例

开发

许可证

变更日志

推荐PyPI第三方库

saj-distributions

gaussian-binomial-package

countdown

py3pdb

pyplating

coronavirusp

flox-core

azurecognitiveservicesvisioncomputervision

mingmingtang

sriram-twitter-scraper

django3-calm-cache

rf-notifier

asyncif

image-functions-barel

juiceutils

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

tinymr 0.1

tinymr的Python项目详细描述

典型字数示例

开发

许可证

变更日志

推荐PyPI第三方库

saj-distributions

gaussian-binomial-package

countdown

py3pdb

pyplating

coronavirusp

flox-core

azurecognitiveservicesvisioncomputervision

mingmingtang

sriram-twitter-scraper

django3-calm-cache

rf-notifier

asyncif

image-functions-barel

juiceutils

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签