未指定细菌种类
unassigner的Python项目详细描述
取消指派者
短16srrna与命名细菌的一致性评价 标记基因序列。
摘要
那16S rRNA gene 在所有的细菌中都有,而且它的基因序列 保守的。细菌16srrna基因的扩增与序列分析 一种常用的细菌群落调查方法 microbiome 研究但是,高吞吐量的仪器无法排序 整个基因因此,该基因的一个短区域被选作 扩增和测序。
所得到的序列,跨越了16S基因的一部分,可以用来 确定样本中存在的细菌类型。例如,一个 序列可能被分配给streptococcus属,基于 序列相似性。有许多程序可以执行这样的操作 分类学作业。
一般认为16srrna基因不适合 细菌种类的划分我们同意,但有一个问题:基因 序列适合于排除分配给许多细菌 物种。这个软件是为了排除所有的物种 与部分16srrna基因不一致的命名 顺序。对于那些没有被明确排除的物种,我们 指定序列与 物种。
因为软件是为了排除物种而不是 在决定最佳分配时,我们称之为unassigner。是一个 俗气的笑话,但我们决定继续讲下去。
unassigner库提供一个命令行程序,unassign
,
在16S基因区提取一份DNA序列的fasta文件,然后
给出序列与附近不一致的概率
细菌种类。
安装
python库和命令行程序可以使用 pip
pip install unassigner
除了安装文件中列出的python库之外,这个程序
需要安装wget
和vsearch
。wget
程序是
用于下载细菌种类的数据,第一次unassign
是跑步。程序vsearch
用于搜索最近的
匹配细菌种类并返回成对序列比对。
用法
unassign
程序需要一个参数,一个fasta格式的文件
短16s序列:
unassign my_sequences.fasta
如果程序以前没有运行过,它将自动下载
它需要的细菌种类数据,格式化它的参考文件,
创建名为my_sequences_unassigned
的输出目录,然后
那里有一个结果表,还有一些辅助输出文件。
有关可用的 选项
贡献
我们欢迎用户提出如何改进此功能的建议 软件。如果你有问题或者想 建议一个功能。