如何确定以下重命名列将出现哪种异常,以及如何在pyspark中处理该异常:
def rename_columnsName(df, columns): #provide names in dictionary format
if isinstance(columns, dict):
for old_name, new_name in columns.items():
df = df.withColumnRenamed(old_name, new_name)
return df.show()
else:
raise ValueError("'columns' should be a dict, like {'old_name':'new_name', 'old_name_one more':'new_name_1'}")
如何通过使用数据集生成异常来测试它
下面是一个如何测试抛出异常的PySpark函数的示例。在本例中,我们正在验证排序顺序为
"cats"
时是否引发异常请注意,测试正在验证所提供的特定错误消息
您可以向
rename_columnsName
函数提供无效输入,并验证错误消息是否符合预期其他一些提示:
withColumnRenamed
李>我找到了这个问题的解决方案,我们可以像python一样在Pyspark中处理异常。 例如:
相关问题 更多 >
编程相关推荐