我正在检查一个文件与另一个文件,以查看我正在检查的项目是否存在于两个文件中。如果项目存在于中,我想打印出项目和项目所在的行。目前我只能打印10366和51954两个文件中的项目。如何打印整行
例如: 如果POS值存在于文件1和文件2中,我想打印
1 10366 rs58108140 G A
1 51954 rs185832753 G C
一号文件
#CHROM POS ID REF ALT QUAL
1 10366 rs58108140 G A
1 10611 rs189107123 C G
1 51954 rs185832753 G C
1 13327 rs144762171 G C
1 13957 . TC T 28
1 13980 rs151276478 T C
文件二
#CHROM POS ID REF ALT QUAL
1 10366 rs58108140 G A
1 51935 rs181754315 C T
1 51954 rs185832753 G C
1 52058 rs62637813 G C
1 52144 rs190291950 T A
1 52238 rs150021059 T G
1 54353 rs140052487 C A
def test():
d= allel.vcf_to_recarray("merged_Small.vcf")
c=d['POS']
df = allel.vcf_to_recarray("FamilyVarient.txt")
d=df['POS']
for a in d:
if a in c:
print(a)
如果您不担心优化问题,那么可以编写一个简单的bash脚本,为文件1中的每个POS greps文件2
相关问题 更多 >
编程相关推荐