能够在本地提取DF的正确数据类型，但如果我在GCP Dataproc（源输入文件）中尝试了相同的方法，则会面临问题

df = spark.read.option("header","true").option("inferSchema","true").csv("Path") colList=df.columns d=df.dtypes print(d) b=[] for x in d: b.append(x[1]) print(b) df1=sc.parallelize([b]).toDF(colList) c=df1.show() print(c)

1条回答

网友

1楼 · 发布于 2024-04-19 15:30:08

我一直在试图复制你的问题，问题可能是驻留在CSV格式。你知道吗

我试图用下一个CSV示例重现这个问题，我可以在cloudshell和Dataproc中找到不同类型的Sample insurance portfolio，您的代码看起来很好。你知道吗

我将通过Dataproc运行作业的结果附加到这里：

尽管如此，我还是建议您看看它上传到云存储桶中的CSV格式。你知道吗

此外，您还可以尝试使用我提供的CSV示例运行作业，以查看它是否与Dataproc或CSV格式有关。你知道吗

我希望这有帮助。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章