我有一百个基因组和.bed文件。我想更改每个基因组的染色体名称(出现在第一列),用物种ID(3个字符)加上MscanX程序的序列号来比较同线区域
当前的bed文件有多种格式。。。染色体数目也不同
例如
CP006020.1 or gi|1002316256|dbj|BCGA01000001.1| or Scaffold_1
你知道如何一个接一个地自动改变它们吗
李 谢谢
编辑:抱歉忘记上传文件。例如,我的输入是
CP006020.1 Ashbya_aceri.g2.t1 4928 6961
CP006020.1 Ashbya_aceri.g3.t1 9344 9862
CP006020.1 Ashbya_aceri.g4.t1 10744 13401
CP006020.1 Ashbya_aceri.g5.t1 16466 16807
CP006020.1 Ashbya_aceri.g6.t1 18381 21437
CP006020.1 Ashbya_aceri.g7.t1 21754 22092
CP006020.1 Ashbya_aceri.g8.t1 22562 23695
CP006020.1 Ashbya_aceri.g9.t1 24921 28616
CP006020.1 Ashbya_aceri.g10.t1 28815 32498
或者
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g1.t1 3762 4427
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g2.t1 5216 5500
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g3.t1 10276 12591
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g4.t1 12621 13423
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g5.t1 23064 23738
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g6.t1 26600 27292
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g7.t1 27601 28044
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g8.t1 33199 33741
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g9.t1 33912 34990
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g10.t1 41641 44574
我只想更改第一列的染色体名称。把原来的改成Chr1,Chr2改成Chr。。。取决于档案里有多少脚手架
抱歉忘记上传文件了。例如,我的输入是
或者
我只想更改第一列的染色体名称。把原来的改成Chr1,Chr2改成Chr。。。取决于档案里有多少脚手架
相关问题 更多 >
编程相关推荐