在pyspark上启用类似pandas的api

sparklingpandas的Python项目详细描述




[![构建状态](https://travis-ci.org/sparklingpandas/sparklingpandas.svg?branch=master)“(https://travis ci.org/sparklingpandas/sparklingpandas)


sparklingpandas
==


sparklingpandas旨在方便地使用pyspark的分布式计算能力
用pandas缩放数据分析。SparklingPandas建立在Spark的DataFrame类的基础上,为您提供了一个抛光的pythonic,熊猫喜欢API。


documentation
=SpkkLang熊猫的基本要求是,您最近有一个(V1.4Br/>)版本的Salk安装-&;http://Spk.Apache。org & gt;和python
2.7。
BR/>使用
因为SparklingPandas使用这个来包含Pyspark库,而不是安装带有PIP的SparkingPandas并导入它。


state
===


我们认真对待反馈意见,并对此表示感谢。
如您所知,我们这些闪闪发光的熊猫是一群相当认真的熊猫。


支持
=


请访问我们的谷歌小组:https://groups.google.com/forum/!论坛/闪亮熊猫

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android键盘暂停   当鼠标拖动时,Java/Swing JViewport会跳转   Java字节码反编译未使用的方法是否存在?   java ToString()方法无法编译   单元测试Java类有注释,如何在没有注释的情况下测试这个类   如何检查是否使用jstl设置了属性(不是null,也不是空字符串)?   如何从main设置setter并从另一个类Java7获取getter   elasticsearch在搜索RESTHighLevelClient Java时忽略空白   java为什么会有这么小的PermGen提交增量?   pdf如何在java中解码JPX图像?   日期:爪哇。时间总体安排DateTimeParseException:无法在索引2处分析文本“103545”   java tuprolog程序术语部分未以句点异常结束   java如何修复mockserver上的SocketTimout执行   java Wicket参数   java如何获取src/main/resources文件夹中文件的路径?   Spring工具套件与SVN集成java类旁边的parens中的数字意味着什么   JDK中Shenandoah 2.0的java可用性