我有以下使用Spark的Python代码:
from pyspark.sql import Row
def simulate(a, b, c):
dict = Row(a=a, b=b, c=c)
df = sqlContext.createDataFrame(dict)
return df
df = simulate("a","b",10)
df.collect()
我正在创建一个Row
对象,并希望将其保存为DataFrame
。
但是,我得到了这个错误:
TypeError: Can not infer schema for type: <type 'str'>
它发生在这条线上:
df = sqlContext.createDataFrame(dict)
我做错什么了?
创建单元素数据框架是没有意义的。如果你想让它工作,尽管使用列表:
df = sqlContext.createDataFrame([dict])
相关问题 更多 >
编程相关推荐