如何使用集群中的多个节点处理海量数据python

with hive.connect(host = 'hostname of that node', port= 10000, authMechanism='LDAP', user='username', password='pass') as conn: with conn.cursor() as cur: cur.execute('select * from tablename') do_not_touch_this_data = pd.DataFrame(cur.fetch())

1条回答

网友

1楼 · 发布于 2024-04-19 05:25:03

分布式系统是一个大而复杂的主题，最好留给专家来处理。你用的是Pyhon，熊猫和蜂巢。您应该切换到Spark，它有自己的DataFrame抽象，类似于Pandas，支持从配置单元表中读取数据，但它将为您处理跨服务器的数据分发。你应该能够很容易地把你在熊猫身上做的任何操作直接翻译成Spark。在

编程相关推荐

java为什么clean glass fish管理控制台不工作？
java 3DES_ECB解密
classpath如何解决由以下原因引起的错误：java。lang.ClassNotFoundException
Junit 3.8中Junit 4的@RunWith注释的java等价物
获取URL时发生java Jsoup HTTP错误。进行申请后处理时，状态=403
使用href link，使用Javaservlet和hibernate从数据库中删除一行
从Get请求调用WebSocket的java
播放框架JavaRESTAPI示例
java将RxJava 1.1.5改编为反应堆堆芯3.1.0。M3
java在每个测试用例之后运行任务

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用集群中的多个节点处理海量数据python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >