一个从纳米孔测序数据增强SNV调用的补充工具。

snvoter的Python项目详细描述


投票人

从低覆盖率纳米孔测序数据(30倍)改进SNV检测。在

安装

使用pypi存储库。在

pip install snvoter

来源。在

^{pr2}$

创建专门的康达环境

snvotter使用其依赖项的几个固定版本。鼓励用户 使用conda或类似环境将包与 默认python实例。GitHub中提供了一个环境文件 存储库。在

git clone https://github.com/vahidAK/SNVoter.git
conda env create -f SNVoter/env/environment.yaml
conda activate snvoter

教程

变量调用

首先需要使用Clair调用变量

您可以使用以下命令和 连接所有文件:

for i in chr{1..22} chrX chrY; do callVarBam --chkpnt_fn <path to model file> --ref_fn <reference_genome.fa> --bam_fn <sorted_indexed.bam> --ctgName $i --sampleName <your sample name> --call_fn $i".vcf" --threshold 0.2 --samtools <path to executable samtools software> --pypy <path to executable pypy > --threads <number of threads>

完整教程请参考Clair GitHub上的页面。在

使用克莱尔的改进型sn呼叫:

snvoter prediction -i <SNVs_Clair.vcf> -b <sorted_indexed.bam> -mf <path to model file (model.h5)> -r <reference_genome.fa> -t number_of_threads -o output_prefix

它将生成两个文件。在

1-预测文件,包括每个5-mer的每个预测。前10名 列来自vcf文件,最后七列表示:

  • chrom:染色体名
  • pos_start:从0开始的5-mer开始位置
  • pos_end:5-mer端的基于0的位置
  • pos:基于0的SNV位置
  • 5-mer序列:5-mer序列
  • Coverage:这可能与Clair的Coverage不同 snvotter使用不同的映射质量阈值
  • 预测

第二个文件是具有加权质量的现成vcf文件。你可以策划 加权质量的分布以获得最佳的滤波阈值。 曲线图通常如下所示: ^{1}$ Quality distribution of 18x coverage dataQuality distribution of 22x coverage data

最佳阈值是第一个峰值的结束和谷的开始 (突出显示的区域)。在

训练一个新的模型

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java是否存在这样一种场景:Java7的Hashmap实现优于Java8的实现   java如何打印这些完整的数组?   java BuildException:未能执行aapt   java如何使用类。未知类型的集合返回的cast()   java准备语句返回错误的值   webview 安卓中的java显示身份验证对话框   java如何重命名列名JPA Hibernate   java查询从特定用户和特定时间段的Oracle表(通过比较原始表和备份表)中选择修改的行   java Youtube视频仅在三星S6设备上加载时自动暂停   未调用java RecyclerView getItemViewType   使用JSch setCommand执行带有源选项的java Shell ping命令时失败   java Hibernate:无法删除|删除分离的实例   Java Spring@MappedSuperclass字段作为子类中的@Id字段   java Android:确定单击了哪个按钮,因为该按钮未在xml中定义   如何计算java阵列内存使用率   使用Java查找按字母顺序排列的第一个字符串   javascript注销功能刷新页面,但页面仍已登录   当接口作为参数提供时,java依赖项注入不起作用   java中带原语的字符串扭曲