短读组装原核基因组的内部bfssi包

ProkaryoteAssembl的Python项目详细描述


原核生物组装

两个简单的脚本组装原核基因组使用成对的末端读取。

管道概述

  1. qc on reads with bbduk.sh(适配器微调/质量过滤)
  2. 用tadpole.sh纠正读取错误
  3. 用skesa汇编reads
  4. 使用bbmap.sh将错误更正的读数与草稿程序集对齐
  5. 用pilon抛光总成

安装

pip install ProkaryoteAssembly

用法

第一个脚本prokaryote_assemble.py一次操作一个样本。

Usage: prokaryote_assemble.py [OPTIONS]

Options:
  -1, --fwd_reads PATH  Path to forward reads (R1) (gzipped FASTQ).
                        [required]
  -2, --rev_reads PATH  Path to reverse reads (R2) (gzipped FASTQ).
                        [required]
  -o, --out_dir PATH    Root directory to store all output files.  [required]
  -m, --memory TEXT     Amount of memory to allocate to job. e.g. "8g".
                        Defaults to 8g.
  --cleanup             Specify this flag to delete all intermediary files
                        except the resulting FASTA assembly.
  --version             Specify this flag to print the version and exit.
  --help                Show this message and exit.

第二个脚本prokaryote_assemble_dir.py将检测 一个目录,并在它可以配对的每个示例上运行程序集管道。

Usage: prokaryote_assemble_dir.py [OPTIONS]

Options:
  -i, --input_dir PATH  Directory containing all *.fastq.gz files to
                        assemble.NOTE: Files must be gzipped in order to be
                        detected.  [required]
  -o, --out_dir PATH    Root directory to store all output files.  [required]
  -f, --fwd_id TEXT     Pattern to detect forward reads. Defaults to "_R1".
  -r, --rev_id TEXT     Pattern to detect reverse reads. Defaults to "_R2".
  -m, --memory TEXT     Memory to allocate to pilon call. Defaults to 8g (i.e.
                        pilon -Xmx8g). May need to provide a large amount of
                        memory for large read sets/assemblies.
  --cleanup             Specify this flag to delete all intermediary files
                        except the resulting FASTA assembly.
  --version             Specify this flag to print the version and exit.
  --help                Show this message and exit.

python(3.6)依赖关系

  • 单击

外部依赖性

注意:所有外部依赖项都必须通过路径可用。

确认有效的版本在括号中。

  • skesa(skesa v.2.1-svn_551987:557549m)
  • BBMap(bbmap版本38.22)
  • samtools(使用htslib 1.8的samtools 1.8)
  • pilon(Pilon版本1.22)

注意: 强烈建议通过Conda安装Pilon,例如 https://bioconda.github.io/recipes/pilon/README.html

conda install pilon

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Hibernate:合并并删除,而不是从数据库中删除实体对象   java如何在WebFilter中有条件地从Mono返回?   java调用mysql c3p0函数   可执行jar Java jar文件加载错误:无法找到或加载主类。类导致的错误:java。lang.ClassNotFoundException:某些东西。班   java如何减少/更改爬网后的延迟?   从其他语言(如Java、PHP、Perl、Python等)调用C/C++代码的最佳方式是什么?   java如何模拟影响对象的void返回方法   当我试图在ubuntu上启动JavaScala时,它抛出了一个异常   java如何正确输出游戏   理解java和C++背景下的JavaScript原型   oracle如何将Java函数转换为postgresql函数   多线程为什么我的java服务器程序在超时后不退出?   java如何使listView中的按钮在单击时工作?   试图将这个嵌套的java forloop转换为python,但我不知道如何转换。有没有一种方法可以像这样为循环执行if语句?   java幂函数在计算器中的应用   如何在java中滚动浏览mysql数据库   在Spring Boot应用程序的JUnit测试中,java没有符合自动连线JPA存储库要求的bean   java如何使用扩展类的JPanel对象?