将NCBI分类转储转换为沿袭的工具
ncbitax2lin的Python项目详细描述
NCBItax2lin公司
将NCBI分类转储转换为沿袭。human (tax_id=9606)的示例 就像
tax_id | superkingdom | phylum | class | order | family | genus | species | family1 | forma | genus1 | infraclass | infraorder | kingdom | no rank | no rank1 | no rank10 | no rank11 | no rank12 | no rank13 | no rank14 | no rank15 | no rank16 | no rank17 | no rank18 | no rank19 | no rank2 | no rank20 | no rank21 | no rank22 | no rank3 | no rank4 | no rank5 | no rank6 | no rank7 | no rank8 | no rank9 | parvorder | species group | species subgroup | species1 | subclass | subfamily | subgenus | subkingdom | suborder | subphylum | subspecies | subtribe | superclass | superfamily | superorder | superorder1 | superphylum | tribe | varietas |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
9606 | Eukaryota | Chordata | Mammalia | Primates | Hominidae | Homo | Homo sapiens | Simiiformes | Metazoa | cellular organisms | Opisthokonta | Dipnotetrapodomorpha | Tetrapoda | Amniota | Theria | Eutheria | Boreoeutheria | Eumetazoa | Bilateria | Deuterostomia | Vertebrata | Gnathostomata | Teleostomi | Euteleostomi | Sarcopterygii | Catarrhini | Homininae | Haplorrhini | Craniata | Hominoidea | Euarchontoglires |
安装
ncbitax2lin需要python-3.7
pip install -U ncbitax2lin
生成血统
从NCBI首次下载分类法转储:
^{pr2}$然后,运行ncbitax2lin
ncbitax2lin taxdump/nodes.dmp taxdump/names.dmp
默认情况下,生成的沿袭将保存到
ncbi_lineages_[date_of_utcnow].csv.gz
。输出文件可以用
--output
选项。在
常见问题解答
Q:我有大量的序列及其相应的加入 NCBI的数字,如何获得他们的血统?在
A:首先,您需要将登录号(GI已弃用)映射到税务标识
基于来自的nucl_*accession2taxid.gz
文件
ftp://ftp.ncbi.nih.gov/pub/taxonomy/accession2taxid/。其次,你可以追踪
序列的整个沿袭基于其税标识
NCBItax2lin可以为您生成什么。在
如果你对这个项目有任何问题,请随时创建一个新的 issue。在
关于taxdump.tar.gz.md5
的注释
NCBI似乎会周期性地重新生成taxdump.tar.gz
,并且
taxdump.tar.gz.md5
即使其含量仍然相同。我不知道怎么做
它们的再生起作用,但是{
用于
- Mahmoudabadi,G.和Phillips,R.(2018年)。对数千种病毒基因组的全面和定量研究。ELife,7岁。https://doi.org/10.7554/eLife.31955
- 项目
标签: