在pyspark上启用类似pandas的api
sparklingpandas的Python项目详细描述
[![构建状态](https://travis-ci.org/sparklingpandas/sparklingpandas.svg?branch=master)“(https://travis ci.org/sparklingpandas/sparklingpandas)
sparklingpandas
==
sparklingpandas旨在方便地使用pyspark的分布式计算能力
用pandas缩放数据分析。SparklingPandas建立在Spark的DataFrame类的基础上,为您提供了一个抛光的pythonic,熊猫喜欢API。
documentation
=SpkkLang熊猫的基本要求是,您最近有一个(V1.4Br/>)版本的Salk安装-&;http://Spk.Apache。org & gt;和python
2.7。
BR/>使用
因为SparklingPandas使用这个来包含Pyspark库,而不是安装带有PIP的SparkingPandas并导入它。
state
===
我们认真对待反馈意见,并对此表示感谢。
如您所知,我们这些闪闪发光的熊猫是一群相当认真的熊猫。
支持
=
请访问我们的谷歌小组:https://groups.google.com/forum/!论坛/闪亮熊猫