未指定细菌种类

unassigner的Python项目详细描述


取消指派者

短16srrna与命名细菌的一致性评价 标记基因序列。

摘要

16S rRNA gene 在所有的细菌中都有,而且它的基因序列 保守的。细菌16srrna基因的扩增与序列分析 一种常用的细菌群落调查方法 microbiome 研究但是,高吞吐量的仪器无法排序 整个基因因此,该基因的一个短区域被选作 扩增和测序。

所得到的序列,跨越了16S基因的一部分,可以用来 确定样本中存在的细菌类型。例如,一个 序列可能被分配给streptococcus属,基于 序列相似性。有许多程序可以执行这样的操作 分类学作业。

一般认为16srrna基因不适合 细菌种类的划分我们同意,但有一个问题:基因 序列适合于排除分配给许多细菌 物种。这个软件是为了排除所有的物种 与部分16srrna基因不一致的命名 顺序。对于那些没有被明确排除的物种,我们 指定序列与 物种。

因为软件是为了排除物种而不是 在决定最佳分配时,我们称之为unassigner。是一个 俗气的笑话,但我们决定继续讲下去。

unassigner库提供一个命令行程序,unassign, 在16S基因区提取一份DNA序列的fasta文件,然后 给出序列与附近不一致的概率 细菌种类。

安装

python库和命令行程序可以使用 pip

pip install unassigner

除了安装文件中列出的python库之外,这个程序 需要安装wgetvsearchwget程序是 用于下载细菌种类的数据,第一次unassign 是跑步。程序vsearch用于搜索最近的 匹配细菌种类并返回成对序列比对。

用法

unassign程序需要一个参数,一个fasta格式的文件 短16s序列:

unassign my_sequences.fasta

如果程序以前没有运行过,它将自动下载 它需要的细菌种类数据,格式化它的参考文件, 创建名为my_sequences_unassigned的输出目录,然后 那里有一个结果表,还有一些辅助输出文件。

有关可用的 选项

贡献

我们欢迎用户提出如何改进此功能的建议 软件。如果你有问题或者想 建议一个功能。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如果同一个线程可以在不同的CPU上调度,为什么它不会产生问题?   java在SWING框架中显示MySQL表   java更改元素的数据   arraylist根据java中的内部对象列表值从对象列表中删除元素   如何在Java中[flat]将多个数组合并到列表中   java错误:“id”列的类型为uuid,但表达式的类型为bytea   QName的java创建采用默认名称前缀,而不是提供的参数   java如何通过ASM捕获字节码中的运行时异常   java JDBC插入查询不在数据库中插入记录   安卓获取错误:无法反序列化对象。未能转换java类型的值。将字符串改为长字符串   java为Redis主/从配置Spring数据Redis和莴苣   java数据结构,用于以数据库表格式计算频率   java JPA:查询匹配不相关实体的许多属性   rmi使用java重新启动远程计算机   java无法加载库“libtesseract302”:找不到指定的模块   java Teradata和JDBC驱动程序classnotfoundexception。。。但是它在那里?   java Android端口转发