我正在处理一个脏数据集,其中需要匹配的两列格式不正确:
我想找出哪些行的“id”与“parent\u id”相同。但是,我无法像这样匹配它:
df["is_the_same"] = (df["id"]==df["parent_id"])
原因其中一些不匹配(例如,id“01004”将“1004”作为父\u id,在这种情况下不匹配)
删除潜在零后,如何选择“id”等于“parent_id”的列
我还尝试:
df["is_the_same"] = df["id"].str.endswith(df["parent_id"])
但似乎.str.endswith只适用于常量字符串(另一列)
将列表理解与
endswith
一起使用:如果仅差前导零和数字将转换值与整数进行比较:
使用^{} ,可以从
id
列中去掉前导零,然后将其与parent_id
列匹配,如下所示:假设这是
df
:相关问题 更多 >
编程相关推荐