ambivert-振幅合并错误截断的变量调用者。在基于扩增子的测序实验中调用变体

ambivert的Python项目详细描述


ambivert的实验α释放
----------


此程序设计用于处理在第二代测序平台(如illumina hiseq/miseq)上生成的基于振幅的重排序数据。在将序列与参考基因组对齐之前,将每个扩增子在
聚类步骤中一起导出。


步骤:
1)聚类相似的读取
2)对齐重叠
3)对齐参考目标序列
4)合并调用
5)输出vcfMat Calls



由Matthew Wakefield和Graham Taylor创建。
版权所有(C)2013 Matthew Wakefield和墨尔本大学。保留所有权利。

$ambivert--help
用法:ambivert[-h][-f forward][-r reverse][-m manifest][-fasta fasta]
[-output output][-countfile countfile]
[-threshold threshold][-min-cover min-cover]
[-min-reads min-reads][--min_freq min_freq]
[--overlap overlap][--hashtable hashtable]
[--savehashtable savehashtable][--alignments alignments]
[--prefix prefix]

ambivert:一个对amplicon数据ambivert集群进行二进制分析的程序
ident基于读取频率的iCal放大器序列和阈值,以消除
技术错误。由于与低频变量相比,出现的排序错误具有更随机的
分布,这种方法减少了必须分配给目标区域的
扩增子产品的数量,并评估了
变量调用。ambivert向前和反向重叠从同一个放大器中读取,并保留本地相位信息。首次使用
的典型运行时间为几个小时,当提供上次运行时计算的
哈希表以分析具有相同放大倍数的后续
样本时,该时间减少到10分钟以内。

sage和exit
-f forward,--forward forward
读取正向放大器的fastq格式文件。可以用带有
适当后缀(.gz)
-r reverse,--reverse reverse
的gzip压缩反向振幅
读取的fastq格式文件。可以使用带有适当后缀(.gz)
-m manifest,--manifest manifest
illumina trueseq amplicon manifest文件的gzip压缩。
--fasta fasta一个fasta amplicon manifest文件。序列应限制在要调用的区域内,不包括引物和适配器。此文件可以在
添加到illumina清单中提供,以指定其他
非目标区域。
--与变量对齐的输出输出。默认值:stdout
--countfile countfile
输出每个放大器的发生计数。包括映射到参考振幅的所有
计数。此计数
不包括频率
低于最小出现阈值--threshold<;default=20>;
--threshold threshold
时发生的读取。忽略出现次数小于阈值
的唯一振幅
序列变体。默认值20
--最小覆盖最小覆盖
调用变量所需的站点的最小覆盖。此参数仅在其为>;
阈值时才有效。默认值0
--最小读取最小读取
包含调用变量所需的读取数
的最小变量数。此参数仅在其为阈值时才具有
效果。默认值0
--min_freq min_freq变异读取的最小比例。默认值为0.1
(百分之十)
--重叠-要合并的正向和反向序列之间所需的最小重叠。默认值为20bp
--哈希表哈希表
文件名,用于预先计算的哈希表,该哈希表与引用的振幅
完全匹配。使用
--savehashtable
--savehashtable savehashtable
生成一个与引用完全匹配的预计算哈希表。用于加快与
--hashtable
--alignments alignments
的匹配将包含
对齐的变量的格式化文本版本打印到文件。"-"将打印到stderr
--前缀前缀--正向,-反向,
--计数文件和--outfile的简写规范。--forward=
<;prefix>;\u r1.fastq.gz--reverse=<;prefix>;\u r2.fastq.gz
--outfile=<;prefix>;.vcf--countfile=<;prefix>;.counts




-------


用法:simulate_variants[-h][--manifest manifest][--fasta fasta]
[--read1 read1][--read2 read2][--skip_softmasked]
[--position_excludes_softmasked]
[--deletions deletions][--check_sam check_sam]

simula从Amplicon目标
文件


可选参数:
-h,--帮助显示此帮助消息并退出
--清单清单清单Illumina TrueSeq Amplicon清单文件。默认值:
none
--fasta fasta扩增子的fasta文件全部位于正链
带描述行的方向">;命名染色体
开始-结束"默认值:none
--read1 read1转发读取的fastq输出文件。默认值:stdout
--read2 read2反向读取的fastq输出文件。默认值:stdout
--跳过软屏蔽不在软屏蔽序列中生成变量。
默认值:true
--位置不包括软屏蔽
计算读取、雪茄和变量检测字符串的开始位置时不包括软屏蔽序列。
默认值:true
--deletions deletions
要插入的大小删除,而不是point
变量。默认值:none
--check_sam check_sam
用于分析的sam文件,以标识名称
与sam文件映射位置和变量字符串不匹配的条目


truseq_manifest
----

用法:truseq_manifest[-h][--manifest manifest][--输出输出][--probes]
[--适配器][--with_probes][--softmask_probes]
[--all_plus]

由修剪程序(例如Nesoni剪辑)使用

ST文件。默认值:
stdin
--输出序列目标的多个fasta输出文件。默认值:
stdout
--探针仅输出ULSO和DLSO引物序列
--适配器将Illumina适配器序列附加到引物
序列
--使用_探针将ULSO和DLSO序列附加到Fasta-target
序列
--软掩模探针将ulso和dlso序列附加到fasta-target
序列
--all-plus重定向目标序列,因此它们都出现在plus链上

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在循环链表中找到最大子序列和   java如何将片段制作为应用程序启动活动   java使用单个json,但发布多个AVRO消息   java无法通过URL连接从站点加载内容   java拒绝名称空间仅在文件扩展名(最后一个点后的部分)上不同的WSDL合法吗?   向ArrayList添加图像时java IndexOutofBounds异常   rest CitrusFramework无法通过java运行   java使用枚举构建象限   ubuntu在独立模式下运行Hadoop:bin/Hadoop:line 350:/usr/local/java/jdk1。8.O/bin/java:没有这样的文件或目录   java如何判断getOutputStream或getwriter是在servlet过滤器中调用的   java如何确保覆盖图中的正确绘图顺序?   java部署在WildFly 10中共享JAR文件   java无法使用Swing将数据添加到表中。我该怎么办?   存储基于表单的应用程序数据的java最佳缓存原则   java比较两个连续的hasmap值   java为什么我的背景在重新绘制后会出现问题?   java Gson Android和异步任务   导出html页面时,java图像不会加载到jasper report中   jsf Netbeans:Java阻止在清理项目时删除文件夹   显示Firebase查询的RecyclerView开始处的java插入对象