仅单向管道(pyplyn)用于python中的数据处理

pyplyn的Python项目详细描述


pyplyn:用于数据处理的单向管道

https://badge.fury.io/py/pyplyn.svghttps://pypip.in/d/pyplyn/badge.pnghttps://pypip.in/license/pyplyn/badge.png

Pyplyn是麻省理工学院授权的基于流的简单数据处理结构,用于 数据处理重复的任务,不必重复自己的每一个 不同的情况。

它基于python可爱的生成器,因此对于每一个进入管道的数据流 以迭代的方式。它目前被用于一个研究项目来处理 一些重复的日常工作。(移动、过滤、更改数据)

尽管如此,项目中使用的pyplyn模块仍然有些肮脏但有用的东西 progressbar、基于ml的分类过滤器等组件 简单的图书馆,我认为处理我们的 重复性任务。

安装

为了安装pyplyn,只需简单地:

pip install pyplyn

或者,从pypi下载包,提取并执行:

python setup.py install

快速启动

Pyplyn旨在以基于流的方式进行数据处理:

import pyplyn as p

pipe = p.Pipe()
pipe.add(p.LineReader("hello.txt"))
pipe.add(p.LambdaFilter(lambda line: len(line) < 50))
pipe.add(p.LineWriter("small_hello.txt"))
pipe.run()

您甚至可以编写自己的pyp模块,如下所示:

import pyplyn as p
import pymongo

class MongoCollection(p.InPypElement):
    def __init__(self, db, collection):
        self.collection = pymongo.MongoClient()[db][collection]
    def grasp(self):
        for document in self.collection:
            yield document

通过以下方式将此新管道元素添加到当前流:

pipe = p.Pipe()
pipe.add(MongoCollection("data","raw"))
pipe.add(p.LambdaExtension(lambda document: document["text"])
pipe.add(p.LineWriter("data_text.txt"))

文档

很抱歉,目前没有,但我建议您检查来源,它是 现在很直截了当。

贡献

任何贡献都是受欢迎的。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
google chrome我在哪里可以下载Mac OSX Lion的Java 6?   java管道化hadoop映射减少作业   java避免在使用jsoup解析html时删除空格和换行符   java将arrayList中的元素相互比较   如何创建一个计算一组数字之和的程序(Java)?   java JavaFX 8 JVM在退出后保留   升华文本3升华文本3 Java交互控制台?   JAVAutil。扫描仪和维基百科   java Android在RecyclerView中更新TextClock的时间格式(12/24小时格式)   java集合,如果达到限制,则可以在添加新项之前删除旧项   hex Java将十六进制转换为带符号的8位代码   java如何使用SQL中其他列的数据?   java如何确保返回指定类型的列表?   列出如何在java中声明匿名arraylist?   在JavaSpringBoot中使用RESTXML文件   使用Java在ColdFusion中计算HMACSHA256摘要的加密