Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在python中使用spark笔记本上的pandas(dashDB上的数据)
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>你好,我用的是IBM Bluemix。 这里我使用的是apachespark笔记本,并从dashDB加载数据 我试图提供一个可视化,它不显示行,只显示列。在</p> <pre><code>def get_file_content(credentials): from pyspark.sql import SQLContext sqlContext = SQLContext(sc) props = {} props['user'] = credentials['username'] props['password'] = credentials['password'] # fill in table name table = credentials['username'] + "." + "BATTLES" data_df=sqlContext.read.jdbc(credentials['jdbcurl'],table,properties=props) data_df.printSchema() return StringIO.StringIO(data_df) </code></pre> <p>使用此命令时:</p> ^{pr2}$ <p>我得到前5行数据的信息,其中包括列和行。 但当我这么做的时候:</p> <pre><code>content_string = get_file_content(credentials) BATTLES_df = pd.read_table(content_string) </code></pre> <p>我得到这个错误:</p> <blockquote> <p>ValueError: No columns to parse from file</p> </blockquote> <p>然后当我试图查看<code>.head()</code>或<code>.tail()</code>时,只显示列名。在</p> <p>有人看到可能的问题吗?我对python很不了解。谢谢你。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这是对我有效的解决方案。 我换了 <code>BATTLES_df = pd.read_table(content_string)</code></p> <p>与</p> <p><code>BATTLES_df=data_df.toPandas()</code></p> <p>谢谢你</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何实现一个类,该类在每次更改其属性时更改其“last_edited”变量?
1 回答
如何实现一个类?
7 回答
如何实现一个类的属性设置?
10 回答
如何实现一个能够存储输入并反复访问输入的存储系统?GPA计算器
5 回答
如何实现一个自定义的keras层,它只保留前n个值,其余的都归零?
2 回答
如何实现一个行为类似于Python中序列的最小类?
10 回答
如何实现一个请求的多线程或多处理
9 回答
如何实现一个长时间运行的、事件驱动的python程序?
6 回答
如何实现一个颜色一致的非舔深度地图实时?
3 回答
如何实现一个默认的SQLAlchemy模型类,它包含用于继承的公共CRUD方法?
4 回答
如何实现一次热编码的生成函数
6 回答
如何实现一种在数组中删除对的方法
5 回答
如何实现一类支持向量机用于图像异常检测
6 回答
如何实现一维阵列到二维阵列的复制转换
3 回答
如何实现三维三次样条插值?
4 回答
如何实现三维数据的连接组件标签?
4 回答
如何实现三角形的空间索引
10 回答
如何实现不同模块中对象之间的交互
8 回答
如何实现不同版本的库共存?
3 回答
如何实现不同的班权重
3 回答