我是python和pandas的新手,我想知道我是否能够让pandas过滤掉数据帧中不一致的信息。例如,假设我有一个包含两列的数据框,(1)产品代码,(2)度量单位。第1列中的同一产品代码可能会重复多次,并且会有多个不同的产品代码,我想过滤掉同一产品代码有多个计量单位的产品代码。理想情况下,当这种情况发生时,过滤器将带来此类产品代码的所有实例,而不仅仅是度量单位不同的实例。为了使我的要求更具色彩,这里的真正目标是识别测量单位不一致的产品代码,因为在所有情况下,相同的产品代码应该始终具有相同的测量单位。你知道吗
提前谢谢!!你知道吗
Tags:
首先,您需要一些产品代码的映射->;度量单位,即基本事实。你可以上传这个,或者试着聪明一点,假设产品代码最常用的度量单位是正确的。你可以这样做
然后你可以得到一个列,它是“正确的”度量单位
然后可以筛选到没有正确映射的行:
试试这个:
样品测向:
分组方式并查看所有非唯一对的计数:
删除重复产品代码的所有行
相关问题 更多 >
编程相关推荐