将基因和基因组映射到全球微生物基因目录(GMGC)
GMGC-mapper的Python项目详细描述
GMGC制图器
查询全球微生物基因目录(GMGC)的命令行工具。在
安装
GMGC映射器运行在python3.6-3.8上,需要 prodigal可用于基因组 模式。在
Conda安装
安装GMGC映射器最简单的方法是通过bioconda,这将确保
所有依赖项(包括prodigal
)都将自动安装:
conda install -c bioconda gmgc-mapper
pip安装
或者,GMGC-mapper
可从PyPI获得,因此可以安装
通过pip:
注意,这不会安装prodigal
(这对于
基因组工作流程)。在
从源安装
最后,特别是如果您要从Github检索最新版本, 您可以使用标准
python setup.py install
示例
- 输入是一个基因组序列。在
gmgc-mapper -i input.fasta -o output
- 输入是DNA/蛋白质基因序列
gmgc-mapper --nt-genes genes.fna --aa-genes genes.faa -o output
核苷酸输入是可选的(但如果可用,则应使用,以便 点击质量可以改进):
gmgc-mapper --aa-genes genes.faa -o output
如果你输入的是一个亚基因组,你可以使用 NGLess用于组装和基因 预测。有关详细信息,read the docs。在
输出
输出文件夹将包含
- 基因预测的结果(挥霍)。在
- 完整的数据表,列出GMGC中每个基因的所有命中率。在
- 所有的结果都在Magbins中找到。在
- 人类可读的摘要。在
有关详细信息,read the docs。描述 为了方便起见,输出也被写入输出文件夹。在
参数
- 在
在-i/--input
:输入基因组文件(.fasta/.gz/.bz2)的路径。在 - 在
在-o/--output
:输出目录(如果不存在,将创建)。在 - 在
在--nt-genes
:输入DNA基因文件(.fasta/.gz/.bz2)的路径。在 - 在
在--aa-genes
:输入蛋白质基因文件(.fasta/.gz/.bz2)的路径。在
- 项目
标签: