我有一个巨大的输入文件
con1 P1 140 602
con1 P2 140 602
con2 P5 642 732
con3 P8 17 348
con3 P9 17 348
我想在每个con内部进行迭代,删除第[2]行和第[3]行中的重复元素,并将结果打印到一个新的.txt文件中,这样我的输出文件如下所示(注意:对于每个con,我的第二列可能不同)
^{pr2}$我尝试的脚本(不确定如何完成)
from collections import defaultdict
start = defaultdict(int)
end = defaultdict(int)
o1=open('result1.txt','w')
o2=open('result2.txt','w')
with open('example.txt') as f:
for line in f:
line = line.split()
start[line[2]]
end[line[3]]
if start.keys() == 1 and end.keys() ==1:
o1.writelines(line)
else:
o2.write(line)
更新:附加示例
con20 EMT20540 951 1580
con20 EMT14935 975 1655
con20 EMT24081 975 1655
con20 EMT19916 975 1652
con20 EMT23831 975 1655
con20 EMT19915 975 1652
con20 EMT09010 975 1649
con20 EMT29525 975 1655
con20 EMT19914 975 1652
con20 EMT19913 975 1652
con20 EMT23832 975 1652
con20 EMT09009 975 1637
con20 EMT16812 975 1649
预期产量
con20 EMT20540 951 1580
con20 EMT14935 975 1655
con20 EMT19916 975 1652
con20 EMT09010 975 1649
con20 EMT09009 975 1637
您可以在此处使用^{} :
输出:
^{pr2}$我说:
盒子上写着:
^{pr2}$您可以简单地执行以下操作:
然后把它写到你的另一个文件里
简单示例
^{pr2}$相关问题 更多 >
编程相关推荐