用于在运行的spark集群上启动和管理服务器的简单python组件

spark-partition-server的Python项目详细描述


#Spark分区服务器

spark partition server是一组轻量级的python组件,用于在spark集群的执行器上启动服务器。

##概述

spark设计用于在集群内操作和分发数据,但不允许客户机直接与数据交互。spark partition server提供在rdd的分区上启动任意服务器、在驱动程序上注册和管理分区服务器以及在分区服务器关闭后收集任何结果rdd的原语。

有很多用例,比如通过跳过spark的作业计划,构建特别的搜索集群来更快地查询数据,允许外部服务作为计算管道的一部分直接与spark上的内存数据交互,以及在涉及直接通信的执行器之间启用分布式计算。spark分区服务器本身为这些用例提供了构建块。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaJSonarray不会从SeekBar读取double   使用另一个类从Java中的2D数组打印用户输入   java ClassNotFoundException的原因   spring调用两个方法以返回Java中的不同页面   httpurlconnection Java禁止的代码错误,但浏览器错误(2)   java画布矩阵转换   java:在另一个java映射中使用“Map”作为值   java“未找到用于解密的证书”(Apache CXF,WSSecurity)   java如何查看JTable中选择的行   java在没有xmlwrappers的情况下重复xml元素序列集   java将垂直直方图打印到控制台   java Spring JDBCTemplate:构造不带特殊字符的JSON   java PayPal RestApi获取用户信息