爆炸读取和otu一致性分类器

brocc的Python项目详细描述


brocc

从blast结果生成基于一致性的分类分配。

使用brocc时请引用以下文件:

Dollive S、Peterfreund GL、Sherrill Mix S、Bittinger K、Sinha R、Hoffmann C、Nabel CS、Hill DA、Artis D、Bachman MA、Custers Allen R、Grunberg S、Wu GD、Lewis JD、Bushman FD。一个用于从人类微生物群样本中定量真核rrna基因序列的工具包。基因组生物学。2012年7月3日;13(7):R60。doi:10.1186/gb-2012-13-7-r60。

安装

要安装brocc,请在当前目录中运行此命令。

pip install .

brocc有两种查找分类单元名称的方法:它可以使用 ncbi分类法的副本,或者它可以使用ncbi的e-utilities来请求 网络上的名字。使用ncbi分类法的本地副本很重要 更快更可靠。要准备此分类数据库,请使用 命令:

create_local_taxonomy_db.py

分类数据库需要大约5g,存储在 ~/.brocc/taxonomy.db默认情况下。

运行

brocc分类器使用输出格式将blast结果作为输入 7(见爆破文件)。以下爆破参数为 发现最适合基于振幅的序列集:

blastn -query <SEQUENCES (FASTA FORMAT)> -evalue 1e-5 -outfmt 7 -db nt -out <BLAST RESULTS> -num_threads 8 -max_target_seqs 100

brocc程序需要两个输入文件和一个输出目录的名称:

brocc.py -i <SEQUENCES (FASTA FORMAT)> -b <BLAST RESULTS> -o <OUTPUT DIRECTORY>

brocc.py输出一个qiime格式的分类法映射和一些日志 提供投票细节的文件。

设置

brocc命令有几个共识形成选项:

  • 最低命中率(供考虑)
  • 最小物种身份(在物种层面考虑)
  • 最小属同一性(供属级考虑)

当前为its1基因设置了默认值,因为 设置似乎在几个不同的放大器上工作得很好。这个 ITS1在物种水平上的最小身份默认值为95.2%,并且 属级83.05%(取自liggenstoffer等人)。18秒, 物种级设置为99.0%,属级设置为96.0% 似乎产生了最准确和稳定的任务。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java扫雷游戏的算法问题。游戏开始时隐藏地雷?   struts2的java迭代器标记   JavaFX如何创建精简菜单栏?   java从SQLite数据库获取字符串并检查是否等于变量不起作用   java如何检查移动数据连接   一旦我将Runnable传递给另一个线程中Swing的invokeAndWait,java就无法停止它   Java中每个键的多线程线程池   java没有可用的EjbContext   组织的java例外初始化错误。springframework。网状物util。UriComponentsBuilder。Android上的newInstance   java GWT CSS GUI通知用户浏览器问题   多线程一个Java编码程序,它读取一个巨大的CSV文件的行   java如何以编程方式打开特定应用程序的Android备份屏幕   java创建一个由10个整数组成的数组,并用1到6之间的随机数填充它   java如何将堆栈传递到方法中   java如何为注解@CurrentUser发送未经授权的响应   java访问switch语句中的对象   java如何正确扩展类   java DropboxAPI入门,未找到类