基于另一个fi筛选txt（GTF）文件

chr1 hg38_refGene exon 67127166 67127257 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077"; chr1 hg38_refGene exon 67131142 67131227 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077"; chr1 hg38_refGene exon 67134930 67134971 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077"; chr1 hg38_refGene start_codon 201283703 201283705 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299"; chr1 hg38_refGene CDS 201283703 201283904 0.000000 + 0 gene_id "NM_000299"; transcript_id "NM_000299"; chr1 hg38_refGene exon 201283452 201283904 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299";

2条回答

网友

1楼 · 编辑于 2024-06-10 03:53:04

试试下面的awk，如果这对您有帮助，它将保存file1.gif和file2.gif中常见的id，并将输出保存到相同的file1.gif中。在

awk 'FNR==NR{array[$2]=$0;next} array[$1]{print array[$1]}' FS='"' file1.gif file2.txt > temp_file  && mv temp_file file1.gif

网友

2楼 · 编辑于 2024-06-10 03:53:04

请尝试以下操作：

awk -F'"' 'NR==FNR { ids[$1]=1;next } ids[$2]' file2.txt file1.gtf

首先用要从file2.txt中筛选的id创建一个数组，然后对于file1.gtf上的每个记录，如果字段$2（split records by”）是数组中的一个id，则只打印该行。在

相关问题更多 >

编程相关推荐

热门问题

热门文章