在VCF文件上操作的各种工具

v-tools的Python项目详细描述


vtools
==


在vcf文件上操作的小工具集。在引擎盖下面使用cyvcf2和cython来提高速度。




工具
----


\vtools filter

将同时输出一个过滤的VCF
>文件和一个包含所有过滤的变量的VCF文件。




<
<
<
<
35 35 35<



非规范非规范染色体非规范染色体非规范染色体是


索引ncalled索引索引未调用或纯合子参考是
太高的gonl-gonl-gonl-af太高的gonl等位基因频率是
太高的gnomad等位基因频率太高的gnomad等位基因频率是
低的gq太低的gq对索引样本的gq是

/>删除的等位基因唯一的alt等位基因是一个删除的等位基因;否####配置

过滤器的配置通过一个小的json文件。
请参见[此处](cfg/example filter.json)以获取示例。



--输出路径到输出(筛选)VCF文件的路径
[必需]
-t,--垃圾路径到垃圾VCF文件的路径[必需]
-p,--参数文件路径到筛选参数json的路径[必需]
--索引示例文本索引示例的名称[必需]
--立即返回/--没有立即返回

达到一个筛选器标准时立即将筛选器写入文件。default=true
--帮助显示此消息并退出。

````

\vtools stats

并将json写入stdout.


--输入文件输入VCF文件[必需]
--帮助显示此消息并退出。
```

\vtools gcoverage

这假设输入vcf文件至少与
gatk的gvcf文件相似。gvcf文件只需要一个样本;如果输入文件包含多个样本,我们只需获取第一个样本。


output是一个简单的tsv文件,包含以下列

/symbol/id








perc_u至少{10、29、30、50、90}外显子的gq值高于外显子的百分比
转录本转录名称/符号/id

*:通过首先计算所有gq
值的p值,然后计算这些p值的平均值来计算平均gq值,最后,将这个数字转换回一个分数。


--refflat文件路径refflat文件的路径[必需]
--每个exon/--每个转录本收集每个exon或每个转录本的度量值
--帮助显示此消息并退出。
````

vtools evaluate

evaluate VCF文件到基线VCF文件包含真正的积极因素。
我们只考虑两个VCF文件中存在的变体。这使得
当两个vcf文件由完全不同的
技术生成时非常有用。例如,当比较一个wes vcf文件和一个snp数组时,这个
工具非常适合我们ewel.

输出是一个简单的json文件,列出了一致和不一致等位基因的计数。

允许使用多样本vcf文件;必须通过cli参数设置要计算的样本。




[要求]
-p,正VCF路径路径到VCF,带有已知的调用[要求]
-CS,在调用VCF中调用样本文本样本(S)来考虑。可能是
称为多次[要求]
-PS,阳性样本文本(S)在阳性VCF中考虑。可能会多次调用[Required]
--帮助显示此消息并退出。
````

由于"v tools"名称已被另一个
包采用,因此安装此vtools需要安装以下内容:

``bash
pip install v-tools
````


编程式的
访问也只适用于

``python
import vtools
````

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java CXF和授权   java在网站中部署使用swing创建的表单   java为什么getHeaderField()返回一个字符串,其中getHeaderFields()返回HttpUrlConnection中的Map<String,List<String>>   java如何检测恶意数据包?   webview中的java网页为空   java SWT图像资源,用于将我的所有图像存储在一个位置   java计算数组的最大长度,使平均值小于给定值   java“发件人电话号码无效”和美国号码   将Swing组件作为内容的自定义Java工具提示不会显示   在并发HashMap中重新灰化期间的java检索   Java 7和Tomcat 7.0.64 ClassFormatException:常量池中的字节标记无效   使用JUnit的java assertNull因NullPointerException失败   java内存中的文件是否与文件系统中的文件大小相同?   循环内实例化的类型的java注入依赖项