拼接ai:一种基于深度学习的识别拼接变体的工具

spliceai的Python项目详细描述


拼接ai:一个基于深入学习的工具,用于识别拼接变体

这个包用他们对剪接的预测效果注释遗传变异,如Jaganathan et al, Cell 2019 in press所述。

安装

安装拼接组件的最简单方法是通过pip:

pip install spliceai

或者,可以从github repository

安装接头ai。
git clone https://github.com/Illumina/SpliceAI.git
cd SpliceAI
python setup.py install

拼接需要tensorflow>;=1.2.0,最好通过pip:pip install tensorflow单独安装。有关其他安装选项,请参见TensorFlow网站。

使用量

接头可以从命令行运行:

spliceai -I input.vcf -O output.vcf -R genome.fa -A grch37

# or you can pipe the input and output VCFs
cat input.vcf | spliceai -R genome.fa -A grch37 > output.vcf

选项:

  • -i:输入带有感兴趣变量的vcf。
  • -o:输出包含拼接预测的vcfSpliceAI=ALLELE|SYMBOL|DS_AG|DS_AL|DS_DG|DS_DL|DP_AG|DP_AL|DP_DG|DP_DL包含在info列中(有关详细信息,请参见下表)。基因中只有snv和简单的indel(ref或alt必须是一个碱基)被注释。多个基因的变异对每个基因都有不同的预测。
  • -r:参考基因组fasta文件。
  • -a:基因注释文件。可以提供grch37grch38来使用包中包含的gencode规范注释文件。要创建自定义注释文件,请使用存储库中的spliceai/annotations/grch37.txt作为模板。

注意:基因中所有可能的snv的注释都可以here下载。

拼接信息字段的详细信息:

IDDescription
ALLELEAlternate allele
SYMBOLGene symbol
DS_AGDelta score (acceptor gain)
DS_ALDelta score (acceptor loss)
DS_DGDelta score (donor gain)
DS_DLDelta score (donor loss)
DP_AGDelta position (acceptor gain)
DP_ALDelta position (acceptor loss)
DP_DGDelta position (donor gain)
DP_DLDelta position (donor loss)

delta score变量的范围从0到1,可以解释为变量被剪接改变的概率。本文给出了0.2(高召回率/可能致病性)、0.5(推荐/致病性)和0.8(高精度/致病性)截止值的详细特征。delta position传递有关拼接相对于变体位置变化的位置的信息(正值位于变体的上游,负值位于下游)。

示例

示例输入文件和相应的输出文件分别位于examples/input.vcfexamples/output.vcfgrch37注释)。变量19:38958362 C>T的输出SpliceAI=T|RYR1|0.22|0.00|0.91|0.70|-107|-46|-2|90可以解释如下:

  • 位置19:38958255用作剪接受体的概率增加了0.22
  • 位置19:38958360用作剪接供体的概率增加了0.91
  • 位置19:38958452用作剪接供体的概率降低了0.70

接触

基肖尔贾加纳坦:kishorejaganathan@gmail.com

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何获得要渲染的纹理   java如何动态确定对象类型的文本的实际类型   java如何用方括号解析参数数组?   java与ECC公钥的长度混淆   JavaLWJGL包括GUI类吗?   java如何打印所有收件箱电子邮件   java在片段中使用RecyclerView而不是活动会导致E/RecyclerView:没有连接适配器;跳过布局错误   为位于系统托盘中的Java程序创建键盘挂钩   使用java将三个json对象合并为一个   java获取范围(x,y)内的随机整数?   java定制primaryStage标题:以图标为中心   命令行无法使用运行java应用程序。jar依赖性“错误:无法找到或加载主类”   java LuaJava编译错误“未解析的外部符号”   如何修复java函数   java文件。Listfile()强制关闭(NullPointerException)   java调试模式在IDEA和Kotlin中停止工作   当使用命名空间STD的C++头文件上运行Sigg时,java丢失分号错误   java如何在使用DBUnit时防止数据删除   找不到java类org/apache/zookeeper/server/NIOServerCnxn$工厂   java无法在上启动jbpmhttp://localhost:8080/businesscentral