我有一个包含客户费用和合同费用的数据框。我想比较每个客户各自的费用,并指出每个客户的不匹配之处。以下是df的外观:
我想添加一个列,以字符串形式包含每行的所有问题。这是我想要的输出,列'Problem'包含每行的所有问题:
到目前为止,我正在努力
nonmatch["Problem"] = np.where(nonmatch['rent'] != nonmatch['rent_doc'], "rent doesn't match", nonmatch["Problem"] + "")
nonmatch["Problem"] = np.where(nonmatch['1xdisc']!=nonmatch['1xdisc_doc']), " 1xdisc doesn't match.", "")
print(nonmatch[['Resident','Problem']])
但是,单元格中已经存在的任何错误都会被覆盖。如果满足条件,如何向单元格内容添加字符串
我也有一种预感,那就是一定有一种更干净的方法来做到这一点,但我不确定如何做到。我有大约十个条件,我想检查,但这是一个最小的例子
我的看法是:
广义的
您也可以尝试使用concat和groupby+agg。正如piR所说,这可能是过度设计的:
相关问题 更多 >
编程相关推荐