如何在python中使用spark笔记本上的pandas（dashDB上的数据）

def get_file_content(credentials): from pyspark.sql import SQLContext sqlContext = SQLContext(sc) props = {} props['user'] = credentials['username'] props['password'] = credentials['password'] # fill in table name table = credentials['username'] + "." + "BATTLES" data_df=sqlContext.read.jdbc(credentials['jdbcurl'],table,properties=props) data_df.printSchema() return StringIO.StringIO(data_df)

2条回答

网友

1楼 · 编辑于 2024-05-14 03:50:31

这是对我有效的解决方案。我换了 BATTLES_df = pd.read_table(content_string)

与

BATTLES_df=data_df.toPandas()

谢谢你

网友

2楼 · 编辑于 2024-05-14 03:50:31

export PYSPARK_DRIVER_PYTHON=ipython
export PYSPARK_DRIVER_PYTHON_OPTS=notebook

去你的星火目录

^{pr2}$

你可以写下面的代码。在

import pandas as pd

编程相关推荐

在Eclipse中使用多个调用在一行上打印java
javajackson序列化问题。只有同一实体的第一个对象可以很好地序列化
Java中Deflate函数的等价充气
使用customlitview的java Android actionbar搜索
java“<T>T get（）”是什么意思？（它有用吗？）
目标c使用CommonCrypto使用AES256加密，使用OpenSSL或Java解密
java在运行时更新资源文件
fileinputstream在java中访问并将数据写入现有文件
带集群的java Android Mapbox我希望每个功能都有不同的标记图像
java JDK8>JDK10:PKIX路径生成失败：SunCertPathBuilderException:找不到请求目标的有效证书路径

相关问题更多 >

编程相关推荐

热门问题

热门文章