如何改变数百个基因组中的染色体名称?

2024-06-06 10:42:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一百个基因组和.bed文件。我想更改每个基因组的染色体名称(出现在第一列),用物种ID(3个字符)加上MscanX程序的序列号来比较同线区域

当前的bed文件有多种格式。。。染色体数目也不同

例如

CP006020.1 or gi|1002316256|dbj|BCGA01000001.1| or Scaffold_1

你知道如何一个接一个地自动改变它们吗

李 谢谢


编辑:抱歉忘记上传文件。例如,我的输入是

CP006020.1  Ashbya_aceri.g2.t1  4928    6961
CP006020.1  Ashbya_aceri.g3.t1  9344    9862
CP006020.1  Ashbya_aceri.g4.t1  10744   13401
CP006020.1  Ashbya_aceri.g5.t1  16466   16807
CP006020.1  Ashbya_aceri.g6.t1  18381   21437
CP006020.1  Ashbya_aceri.g7.t1  21754   22092
CP006020.1  Ashbya_aceri.g8.t1  22562   23695
CP006020.1  Ashbya_aceri.g9.t1  24921   28616
CP006020.1  Ashbya_aceri.g10.t1 28815   32498

或者

gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g1.t1 3762    4427
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g2.t1 5216    5500
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g3.t1 10276   12591
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g4.t1 12621   13423
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g5.t1 23064   23738
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g6.t1 26600   27292
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g7.t1 27601   28044
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g8.t1 33199   33741
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g9.t1 33912   34990
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g10.t1    41641   44574

我只想更改第一列的染色体名称。把原来的改成Chr1,Chr2改成Chr。。。取决于档案里有多少脚手架


Tags: or文件名称基因组t1bed染色体gi
1条回答
网友
1楼 · 发布于 2024-06-06 10:42:46

抱歉忘记上传文件了。例如,我的输入是

CP006020.1  Ashbya_aceri.g2.t1  4928    6961
CP006020.1  Ashbya_aceri.g3.t1  9344    9862
CP006020.1  Ashbya_aceri.g4.t1  10744   13401
CP006020.1  Ashbya_aceri.g5.t1  16466   16807
CP006020.1  Ashbya_aceri.g6.t1  18381   21437
CP006020.1  Ashbya_aceri.g7.t1  21754   22092
CP006020.1  Ashbya_aceri.g8.t1  22562   23695
CP006020.1  Ashbya_aceri.g9.t1  24921   28616
CP006020.1  Ashbya_aceri.g10.t1 28815   32498

或者

gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g1.t1 3762    4427
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g2.t1 5216    5500
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g3.t1 10276   12591
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g4.t1 12621   13423
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g5.t1 23064   23738
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g6.t1 26600   27292
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g7.t1 27601   28044
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g8.t1 33199   33741
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g9.t1 33912   34990
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g10.t1    41641   44574

我只想更改第一列的染色体名称。把原来的改成Chr1,Chr2改成Chr。。。取决于档案里有多少脚手架

相关问题 更多 >