我想对DataFrame列应用映射。对于熊猫,这是直接的:
df["infos"] = df2["numbers"].map(lambda nr: custom_map(nr, hashmap))
这将基于custom_map
函数写入infos
列,并使用lambda
语句的数字行。
对于dask来说,这并不是那么简单。ddf
是一个dask数据帧。map_partitions
相当于在数据帧的一部分上并行执行映射。
这不起作用,因为您没有在dask中定义类似的列。
ddf["infos"] = ddf2["numbers"].map_partitions(lambda nr: custom_map(nr, hashmap))
有人知道我如何使用这里的列吗?我一点也不明白他们的意思。
目前没有回答
相关问题 更多 >
编程相关推荐