用于在运行的spark集群上启动和管理服务器的简单python组件
spark-partition-server的Python项目详细描述
#Spark分区服务器
spark partition server是一组轻量级的python组件,用于在spark集群的执行器上启动服务器。
##概述
spark设计用于在集群内操作和分发数据,但不允许客户机直接与数据交互。spark partition server提供在rdd的分区上启动任意服务器、在驱动程序上注册和管理分区服务器以及在分区服务器关闭后收集任何结果rdd的原语。
有很多用例,比如通过跳过spark的作业计划,构建特别的搜索集群来更快地查询数据,允许外部服务作为计算管道的一部分直接与spark上的内存数据交互,以及在涉及直接通信的执行器之间启用分布式计算。spark分区服务器本身为这些用例提供了构建块。