from collections import Counter
# after processing your CSV files into two lists:
more_list = ['A123', 'B456', 'C789', 'D007']
less_list = ['B456', 'D007', 'E009']
dupe_counter = Counter(more_list)
dupe_counter.update(less_list)
same_list = [val for val in dupe_counter if dupe_counter[val] > 1]
# same_list will be: ['B456', 'D007']
将CSV文件处理成列表后,可以使用
collections.Counter
查找重复项:如果它们只有一行,可以使用set对象(python内置的)来比较它们,例如:
从文件进行比较的完整方法如下所示:
^{pr2}$如果每个文件不止一行,那么您仍然可以使用它,您只需稍微修改一下它-我想将交集存储到一个表示逐行相似性的数组中。在
相关问题 更多 >
编程相关推荐