如何在一个代码工作簿中合并Palantir Foundry中的两个数据集?

2024-04-28 15:07:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在Palantir Foundry的代码工作簿中合并两个数据集,但我不知道如何做到这一点。我想用Pyspark来做这个。我是铸造厂的新手,请帮帮我


Tags: 数据代码foundrypyspark铸造厂新手palantir帮帮我
1条回答
网友
1楼 · 发布于 2024-04-28 15:07:25

这与您在任何其他环境中使用PySpark的方式相同

如果您想用相同的模式联合两个数据集,比如datasetAdatasetB,您可以执行以下操作

dataset_unioned = datasetA.unionByName(datasetB)

同样,这假设(并且您可能应该确保您的数据结构符合这一点)您的两个数据集具有相同的模式。签出PySpark文档here

相关问题 更多 >