2024-04-17 23:11:59 发布
网友
我只想在DataFrame df中选择那些在device列或id列中具有值d1或d2的行。你知道吗
df
device
id
d1
d2
我执行了以下代码:
df = df.where("id=0 or device in ('d1', 'd2')")
但是,当我运行此代码时:
df.select('device').distinct().rdd.map(lambda r: r[0]).collect()
..,我得到这个结果:
d1 d2 d3 d4
我不明白为什么d3和d4会出现?你知道吗
d3
d4
你做到了
现在它将返回df1、df2中id=0或device的所有行。现在id=0可以将df3/df4作为设备
如果你想省略df3,df4你应该这样做
df = df.where("id=0 and device in ('d1', 'd2')")
你做到了
现在它将返回df1、df2中id=0或device的所有行。现在id=0可以将df3/df4作为设备
如果你想省略df3,df4你应该这样做
相关问题 更多 >
编程相关推荐