熊猫流媒体业务。

pandas_streaming的Python项目详细描述


自述文件

Build statusBuild Status Windowshttps://circleci.com/gh/sdpython/pandas_streaming/tree/master.svg?style=svghttps://badge.fury.io/py/pandas_streaming.svgMIT LicenseRequirements Statushttps://codecov.io/github/sdpython/pandas_streaming/coverage.svg?branch=masterGitHub IssuesWaffleNotebook Coveragehttps://api.codacy.com/project/badge/Grade/f53b7f4d6a0447aa9ce0c4ad5df659ef

pandas_streaming 目的是用pandas处理大文件, 太大而无法保存在内存中,太小而无法与显著的增益并行。 模块复制pandasapi的子集 并实现机器学习的其他功能。

from pandas_streaming.df import StreamingDataFrame
sdf = StreamingDataFrame.read_csv("filename", sep="\t", encoding="utf-8")

for df in sdf:
    # process this chunk of data
    # df is a dataframe
    print(df)

模块还可以流出一个现有的数据文件。

import pandas
df = pandas.DataFrame([dict(cf=0, cint=0, cstr="0"),
                       dict(cf=1, cint=1, cstr="1"),
                       dict(cf=3, cint=3, cstr="3")])

from pandas_streaming.df import StreamingDataFrame
sdf = StreamingDataFrame.read_df(df)

for df in sdf:
    # process this chunk of data
    # df is a dataframe
    print(df)

链接:

历史

当前-2018-05-17-0.00MB

  • 6:添加Pyensae(2018-05-17)的Pandas_Groupby_nan

0.1.66-2018-02-05-0.02MB

  • 5:将随机状态参数添加到拆分函数(2018-02-04)
  • 2:添加方法样本,保留样本(2017-11-05)
  • 3:内存不足数据集的方法列测试分割(2017-10-21)
  • 1:为您的项目感到兴奋(2017-10-10)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何加载。java文件到编译器?   java写入文件和I/O   java日历返回错误的当前日期安卓   if语句if变量等于1(java)   java很难让Joda有时间使用我的bukkit插件   json如何创建基于java的应用程序,该应用程序将从网站获取输入   java如何在多页中打印大型JPanel   java my spinner在添加从firebase数据库中选择的多个值时被覆盖   java用Play框架覆盖HTTP方法   试图获取所有用户时,java错误请求400。Dto和表格   java支持bean加载图像后javascript自动调用JS函数   java在MTOM的@StreamingAttachment(Metro)中,Parsely的意思是什么   具有可抢占线程队列的多线程java执行器   Java Opencv connectedComponentsWithStats   java如何向数组中添加2D数组的数目   eclipse为什么我的Java Zork克隆不能正确循环?   java在哪里放置定制的第二个web。xml   java如何更改最近应用列表中显示的快照?   java Browser#getText()返回空字符串