如何用das映射列

2024-06-10 09:56:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我想对DataFrame列应用映射。对于熊猫,这是直接的:

df["infos"] = df2["numbers"].map(lambda nr: custom_map(nr, hashmap))

这将基于custom_map函数写入infos列,并使用lambda语句的数字行。

对于dask来说,这并不是那么简单。ddf是一个dask数据帧。map_partitions相当于在数据帧的一部分上并行执行映射。

这不起作用,因为您没有在dask中定义类似的列。

ddf["infos"] = ddf2["numbers"].map_partitions(lambda nr: custom_map(nr, hashmap))

有人知道我如何使用这里的列吗?我一点也不明白他们的意思。


Tags: 数据lambda函数mapdataframedfcustomnr