没有项目描述

redundans的Python项目详细描述


###目录
-**[冗余](冗余)**
-**[先决条件](先决条件)**
-**[Unix安装程序](Unix安装程序)**
-**[Docker映像](Docker映像)**
-**[运行管道](运行管道)**
-**[参数](参数)**
-**[试运行](试运行)**
-**[支持](支持)**
-**[引用](引用)**

冗余

冗余管道有助于**杂合子基因组的组装**。
程序接受[作为输入](参数)**组装的contigs**、**测序库**和/或**参考序列**,并返回**支架纯合子基因组组装**。最终组装应该**更少碎片**,总**尺寸小于**输入控件。此外,冗余将自动**关闭由基因组组装或支架形成的间隙**。

<;img align="right" src="/docs/redundans_flowchart.png">;

管道由三个步骤/模块组成:
1。**冗余减少**:从初始*从头*装配中检测和选择性移除冗余contig
2。**支架**:使用成对末端读取、配对、长读取和/或参考染色体连接基因组片段
3。**间隙闭合**:使用成对端部和/或配对读取数据填补脚手架后的间隙


因此,它甚至可以在笔记本电脑上运行,用于中小型基因组
-**灵活**面向多种测序技术(illumina,454,sanger,pacbio&nanopore)和库类型(成对末端,配对,fosmids,长读)
-**模块化**:每一步都可以由其他工具
-**可靠**:它已经被用于改进大小(从几MB到几GB)和复杂度(真菌、动物和植物)不同的基因组组合

有关更多信息,请参阅[文档](/docs)、[海报](/docs/poster.pdf)。[出版物](http://nar.oxfordjournals.org/content/44/12/e113)和[测试数据集](/test)。

先决条件
redundans使用多个程序(均在此存储库中提供):
-[最后](http://last.cbrc.jp/)v700+
-[bwa](http://bio-bwa.sourceforge.net/)v0.7.12+
-[对齐器](https://github.com/amplab/snap)
-[sspace3](http://www.baseclear.com/genomics/bioinformatics/basetools/sspace)
-[gapcloser](http://sourceforge.net/projects/soapdenovo2/files/gapcloser/)
-[pyscaf](https://github.com/lpryszcz/pyscaf)
-[fastaindex](https://github.com/lpryszcz/fastaindex)

安装应该简单到:
```
git clone--recursive https://github.com/lpryszcz/redundans.git
cd redundans
(cd bin/bwa&;make clean&;make)
(cd bin/last&;make clean&;make)
(cd bin/snap&;make clean&;make)
```

如果失败,请确保安装了以下依赖项:
-python 2.7或2.6
-perl[sspace3]
-make、gcc&g++[bwa&;最后]即'sudo apt get install make gcc g++`
-[zlib包括zlib.h头](http://zlib.net/)[bwa]即'sudo apt get install zlib1g dev`
-可选用于绘制'numpy'和'matplotlib'即'sudo-h pip install-u matplotlib numpy`

以方便用户,我们提供[Unix安装程序](Unix安装程序)和[Docker映像](Docker映像),可以使用它们来代替手动安装。

Unix安装程序
Unix安装程序将自动获取、编译和配置冗余以及所有依赖项。
它应适用于所有现代Linux系统,给定Python2.7、常用程序(即wget、curl、g it、perl、gcc、g++,ldconfig)和库(zlib包括zlib.h)已安装。
`` bash
源代码<;(curl-ls http://bit.ly/redundans_安装程序)
```

###docker image
首先需要安装[docker](https://www.docker.com/):`wget-qo-https://get.docker.com/sh`
然后,您可以通过执行:
`` bash
`处理映像中的数据-所有数据将在结束时丢失
docker run-it-w/root/src/redundans lpryszcz/redundans./redundans.py-v-i test/{6005000}{1,2}.fq.gz-f test/contigs.fa-o test/run1

处理本地文件,您需要使用-v
安装卷,确保您位于redundans repo目录(包含test/directory)
docker run-v`pwd`/test:/test:rw-it lpryszcz/redundans/root/src/redundans/redundans.py-v-i test/*.fq.gz-f test/contigs.fa-o test/run1
```
docker映像非常重要方便,但有一定的局限性。
对我来说最烦人的是**缺少自动完成**,除非您以与上面示例完全相同的方式指定主机和容器中的路径。
此外,卷每次都需要装入,这会导致一些复杂的命令。< BR>[(https://images.microbadger.com/badges/version/lpryszcz/redundans.svg)](https://hub.docker.com/r/lpryszcz/redundans/)
![](https://images.microbadger.com/badges/image/lpryszcz/redundans.svg)

\支持pacbio和nanopore
-和/或**参考染色体/contigs**(fasta)
*也接受gzip fastq/fasta文件。

冗余将在"scaffolds.filled.fa"(fasta)中返回**纯合基因组组装**。
此外,程序报告[每个管道步骤的统计数据](/test摘要统计数据),包括移除的contig数量、gc含量、n50、n90和间隙区域的大小。

尽管您还应该指定一些序列库(fasta/fastq)或引用序列(fasta)以执行构建。
大多数管道参数都可以手动调整(默认值用方括号[]):
**提示**:如果运行失败,可以尝试通过添加"--resume"参数来恢复。
-一般选项:
```
-h,--帮助显示此帮助消息并退出
-v,--详细详细
--版本显示程序的版本号并退出
-f fasta,--fasta fasta
程序集fasta文件
-o outdir,--outdir outdir
输出目录[冗余]
-t线程,--线程
要运行的线程数[4]
--恢复上一次运行
--将日志输出日志记录到[stderr]
````
-缩减选项:
`````
--标识最小值。标识[0.51]
--重叠最小值。重叠[0.66]
--最小长度最小长度
最小连续长度[200]
`````
-脚手架选项:
`````
-i fastq[fastq…],--fastq fastq[fastq…]
fastq pe/mp文件
-j连接,--连接
连接到contigs的最小k对数[5]
-链接比率,--链接比率链接比率
两个最佳连接对之间的最大链接比率[0.7]
--读取的极限对齐子集[0.2]
对齐读取的子集[0.2];这意味着将对齐0.2*基因组大小的读取;因此对于100MB基因组,冗余将处理每个库的20M读操作
-q mapq,--mapqmapq最小映射质量[10]
-iters iters每个库的scaffolding迭代[2]
-l[长读[长读…]],--长读[长读[长读…]]
fastq/fasta长读文件
-r参考,--引用引用
reference fasta file
--norarrangements high identity mode(不允许重排)
`````

redundans是**非常灵活的**。可以使用`--noreduction`、`--noscaffolding`和/或`--nogapclosing`参数命令管道的所有步骤。

要运行测试示例,请执行:
``bash
./redundans.py-v-i test/*.fq.gz-f test/contigs.fa-o test/run1

您可以尝试恢复它
rm test/run1/\u sspace.2.1.filled.fa
./redundans.py-v-i test/*.fq.gz-f test/contigs.fa-o test/run1--resume
````

注意,**库的顺序(`-i/--input`)并不重要**,只要每个库中的"read1"和"read2"相继给出
即"-i 600_1.fq.gz 600_2.fq.gz 5000_1.fq.gz 5000_2.fq.gz"将被解释为"-i 5000_1.fq.gz 5000_2.fq.gz 600_1.fq.gz 600_2.fq.gz"。

您可以使用**任何输入组合**成对端、配对对、长读和/或基于引用的脚手架,例如:
`` bash
reduction、成对端、配对对和长读的脚手架、成对端和配对对的间隙闭合
./redundans.py-v-i test/*.fq.gz-l test/pacbio.fq.gz test/nanopore.fa.gz-f试验/连续试验/运行短/长

两端成对读数
./redundans.py-v-i test/600?.fq.gz-r test/ref.f a-f test/contigs.fa-o test/run戋ref戋pe-closing--noscaffolding
````

有关详细信息,请参阅[测试目录](/test)。


您可能还需要登录[我们的论坛](https://groups.google.com/d/forum/redundans)。



纳尔[doi:10.1093/nar/gkw294](http://nar.oxfordjournals.org/content/44/12/e113)




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当使用RequestDispatcher时,servlets Java最终没有被调用   java生成对具有可变参数数的方法的调用   java如何使用select子句中的参数化列映射iBATIS的查询?   java无法创建类型为org的插件。阿帕奇。登录中。log4j。果心阿佩德。元素RollingFile的RollingFileAppender   java当子实体和父实体之间存在OneTONE JPA关系时,是否可以将其与父实体一起持久化?   Android上的java Facebook集成fbconnect断开链接   获取方法调用方的java机制   从列表创建Oracle阵列时出现java问题   添加和检索元素的ArrayList的java ArrayList   在java中从字符串中删除无效的XML字符   java如何构建完整生成的maven模块   java如何准确地改变播放所有分辨率midi文件的速度?   shell javac:无效标志:/src/中位_度。ubuntu中的java   java使用从其他类的方法检索到的信息