结构变异的贝叶斯基因分型

svtyper的Python项目详细描述


版权所有(c)2014 Colby Chiang

修改、合并、发布、分发、再授权和/或出售本软件的
副本,并允许向其提供本软件的人员这样做,但须满足以下条件:





b软件的基本部分。

软件按"原样"提供,不提供任何形式的明示或暗示保证,包括但不限于适销性保证,
适用于特定用途和不侵权。在任何情况下,
作者或版权持有人均不对任何索赔、损害或其他
责任负责,无论是在合同诉讼、侵权诉讼或其他诉讼中,由软件或
软件的使用或其他交易引起的或与之相关的。n:svtyper
==
[![Github许可证](https://img.shields.io/badge/license-mit-blue.svg)](https://raw.githubusercontent.com/hall-lab/svtypes/master/license)
[![构建状态](https://travis-ci.org/hall-lab/svtypes.svg?branch=master)"(https://travis-ci.org/hall-lab/svtypes)


>结构变异的贝叶斯基因型

<35;\overview


svtyper使用全基因组测序数据执行结构变异(svs)的断点基因型。用户必须向基因型提供站点的VCF文件(可能由[lumpy]生成(https://github.com/arq5x/lumpy-sv))以及Illumina成对的BAM/CRAM文件-与[bwa-mem]对齐的结束读取(https://github.com/lh3/bwa)。SVtyper评估成对末端和分裂读取比对中的不一致和一致读取,以推断每个位点的基因型。算法细节和基准测试在[Chiang等人,2015年](http://www.nature.com/nmeth/journal/vaop/nccurrent/full/nmeth.3505.html)中有描述。

![NA12878杂合子缺失](etc/en.png?安装<<<<<<<<<<<<<<>
"svtypes"依赖于[pysam][0][(0.15.0或更新版本)、[numpy][1]和[scipy][2];"svypsso"还依赖于[cytolz][7]。如果依赖项在您的系统上不可用,"pip"将尝试下载并安装它们。







`svtypes'是基因分型算法的原始实现,可用于多个样本。"svtype-sso"是"svtypes"的另一个实现,它针对单个样本的基因分型进行了优化。"svtype-sso"是"svtypes"的并行实现,它通过[multiprocessing][8]模块利用多个cpu核。"svype-sso"可以在对单个样本进行基因分型时提供2倍或更多的加速(取决于使用了多少CPU内核)。**u注意:svtypesso还不稳定。两者之间的日志记录存在细微差异,在处理cram文件时,sso可能会提前退出并出现错误。**

\35;\35;示例用法

\35;\35;'svyp





\35;'35;作为命令行python脚本

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
即时消息端口svtyper.classic作为svt

input_vcf="/path/to/input.vcf"
input_bam="/path/to/input.bam"
library_inf o="/path/to/library_info.json"
output_vcf="/path/to/output.vcf"

输出vcf,"w")作为输出:
svt.sv_基因型(bam_string=input_bam,
vcf_in=inf,
vcf_out=outf,
min_aligned=20,
split_weight=1,
disc_weight=1,
num_samp=1000000,
lib_info_path=library_info,
debug=false,
alignment_outpath=none,
ref_fasta=none,
sum_quals=false,
max_reads=none)

ash
svtyper sso\
--core 2要使用的CPU核数\
--批处理大小1000要在单个批处理中处理的SV数(默认值:1000)\
--最大读取数1000如果SV包含大于此阈值的有效读取,则跳过基因分型(默认值:1000)\
-i sv.vcf\
-b sample.bam\
-l sample.bam.json\
>;sv.gt.vcf
`````

/>input_vcf="/path/to/input.vcf"
input_bam="/path/to/input.bam"
library_info="/path/to/library_info.json"
output_vcf="/path/to/output.vcf"

以open(input_vcf,"r")作为inf,open(output_vcf,"w")作为outf:
sso.sso_基因型(bam_string=input_bam,
vcf_in=inf,
vcf_out=outf,
min_aligned=20,
split_weight=1,
disc_weight=1,
num_samp=1000000,
lib_info_path=library_info,
debug=false,
alignment_outpath=none,
ref_fasta=none,
sum_quals=false,
最大读取数=1000,
核心数=2,
批处理大小=1000)

内容:
-python 2.7或更新版本
-gnu make
-[virtualenv][3](或[conda][4]用于[anaconda][5]或[miniconda][6]用户)设置开发环境它克隆了https://github.com/hall lab/svtyper.git
cd svtyper
virtualenv myvenv
source myvenv/bin/activate
pip install-e.
<;添加、编辑或删除代码>;
make test

您已经完成了开发
git push<;remote name>;<;branch>;
停用
cd。&;rm-rf svtyper

\当提示"继续([Y]/N)"时为"Y"?
源代码激活mycenv
pip install-e.
<;添加、编辑或删除代码>;
完成开发后进行测试



源关闭
cd..&;rm-rf svtyper
conda remove--name mycenv--all

\svtyper提供评估和可视化序列库特性的方法。

svtyper将对文件的前n次读取(默认为100万次)进行采样,以解析库、读取组和插入大小直方图。这可以在没有vcf文件的情况下完成。```
svtyper\
-b my.bam\
-l my.bam.json
````

r/>脚本/lib_stats.r my.bam.json my.bam.json.pdf
````
![插入大小直方图](etc/my.bam.json.png?raw=true"插入大小直方图")


SpeedSeq:超快速个人基因组分析和解释。NAT方法12966-968(2015年)。doi:10.1038/nmeth.3505.


[0]:https://github.com/pysam developers/pysam
[1]:http://www.numpy.org/
[2]:https://www.scipy.org/
[3]:https://github.com/pypa/virtualenv
[4]:https://conda.io/docs/index.html
[5]:https://docs.continuum.io/anaconda/
[6]:https://conda.io/miniconda.html
[7]:https://github.com/pytoolz/cytoolz
[8]:https://docs.python.org/2/library/multiprocessing.html

平台:未知
分类器:目标受众::科学/研究
分类器:主题::科学/工程::生物信息学
分类器:许可证::OSI批准::MIT许可证
分类器:编程语言::Python::2.7

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java有没有一种方法可以使用DesiredCapabilities在SeleniumWebDriver中获得非远程浏览器?   java逻辑和算术移位的输出   java如何以编程方式在Selenium中打开Safari>preferences?   java应用程序可以在javaws中更改自己的名称吗?   Java 7下的linux JAXB问题它说找不到RI 2.1.0   java解析来自Domino代理的JSON   java如何引用在不同类的main方法中声明的对象属性   java如何扩展apache FTPFile的功能?   java如何优化G1的暂停时间   java使用单个“更新”按钮将测试表的自动增量值插入分数表   针对UTF的regex Java电子邮件验证   java字节流问题   java 安卓将arraylist转换为自定义格式的一个字符串   java SQL语句到JTable   Java:带selfcontain计数器的while循环