将csv加载到PySp中的DataFrame时出现问题

1条回答

网友

1楼 · 发布于 2024-04-19 18:11:37

我认为您给csv函数传递了错误的参数。我相信GlueContext.read.csv()将获得^{}的实例，它的签名将文件名作为第一个参数，而您传递的是一个类似文件的对象。在

def f(glueContext, aggregated_csv, schema):
    with open('somefile', 'a+') as agg_file:
        agg_file.write(aggregated_csv)
        #agg_file.seek(0)
    df = glueContext.read.csv('somefile', schema=schema, header="true")
    df.show()

但是，如果你想要它写一个ORC文件，并且你已经把数据读作aggregated_csv，你可以直接从元组列表中创建一个{}。在

^{pr2}$

然后，如果需要GlueDynamicFrame，请使用fromDF函数

dynF = fromDF(df, glueContext, 'myFrame')

还有一个，但是：你不需要胶水来写兽人-火花它完全可以。只需使用^{}函数：

df.write.orc('s3://path')

编程相关推荐

java如何将JSP与Hibernate连接？
java无法退出do while循环，即使表达式为false
使用Restlet和GAE过滤根路径
java<rich:popupanel按钮在JSF项目中不起作用
java错误：在安卓包中找不到属性“showAsAction”的资源标识符
性能Java 2D：在屏幕上快速渲染大量瓷砖
java Android MediaPlayer seekTo（0）不寻求启动
java使用jsweet将小程序代码转换为js。类文件依赖关系
java Maven导入问题，在complie时间使用里程碑版本，但在运行时使用最新版本
java JPA：从另一个对象访问对象返回null

相关问题更多 >

编程相关推荐

热门问题

热门文章

将csv加载到PySp中的DataFrame时出现问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >