在VCF文件上操作的各种工具
v-tools的Python项目详细描述
vtools
==
在vcf文件上操作的小工具集。在引擎盖下面使用cyvcf2和cython来提高速度。
工具
----
\vtools filter
将同时输出一个过滤的VCF
>文件和一个包含所有过滤的变量的VCF文件。
<
<
<
<
35 35 35<
;
;
非规范非规范染色体非规范染色体非规范染色体是
索引ncalled索引索引未调用或纯合子参考是
太高的gonl-gonl-gonl-af太高的gonl等位基因频率是
太高的gnomad等位基因频率太高的gnomad等位基因频率是
低的gq太低的gq对索引样本的gq是
/>删除的等位基因唯一的alt等位基因是一个删除的等位基因;否####配置
过滤器的配置通过一个小的json文件。
请参见[此处](cfg/example filter.json)以获取示例。
--输出路径到输出(筛选)VCF文件的路径
[必需]
-t,--垃圾路径到垃圾VCF文件的路径[必需]
-p,--参数文件路径到筛选参数json的路径[必需]
--索引示例文本索引示例的名称[必需]
--立即返回/--没有立即返回
当
达到一个筛选器标准时立即将筛选器写入文件。default=true
--帮助显示此消息并退出。
````
\vtools stats
并将json写入stdout.
--输入文件输入VCF文件[必需]
--帮助显示此消息并退出。
```
\vtools gcoverage
这假设输入vcf文件至少与
gatk的gvcf文件相似。gvcf文件只需要一个样本;如果输入文件包含多个样本,我们只需获取第一个样本。
output是一个简单的tsv文件,包含以下列
/symbol/id
perc_u至少{10、29、30、50、90}外显子的gq值高于外显子的百分比
转录本转录名称/符号/id
*:通过首先计算所有gq
值的p值,然后计算这些p值的平均值来计算平均gq值,最后,将这个数字转换回一个分数。
--refflat文件路径refflat文件的路径[必需]
--每个exon/--每个转录本收集每个exon或每个转录本的度量值
--帮助显示此消息并退出。
````
vtools evaluate
evaluate VCF文件到基线VCF文件包含真正的积极因素。
我们只考虑两个VCF文件中存在的变体。这使得
当两个vcf文件由完全不同的
技术生成时非常有用。例如,当比较一个wes vcf文件和一个snp数组时,这个
工具非常适合我们ewel.
输出是一个简单的json文件,列出了一致和不一致等位基因的计数。
允许使用多样本vcf文件;必须通过cli参数设置要计算的样本。
[要求]
-p,正VCF路径路径到VCF,带有已知的调用[要求]
-CS,在调用VCF中调用样本文本样本(S)来考虑。可能是
称为多次[要求]
-PS,阳性样本文本(S)在阳性VCF中考虑。可能会多次调用[Required]
--帮助显示此消息并退出。
````
由于"v tools"名称已被另一个
包采用,因此安装此vtools需要安装以下内容:
``bash
pip install v-tools
````
编程式的
访问也只适用于
``python
import vtools
````
==
在vcf文件上操作的小工具集。在引擎盖下面使用cyvcf2和cython来提高速度。
工具
----
\vtools filter
将同时输出一个过滤的VCF
>文件和一个包含所有过滤的变量的VCF文件。
<
<
<
<
35 35 35<
;
;
非规范非规范染色体非规范染色体非规范染色体是
索引ncalled索引索引未调用或纯合子参考是
太高的gonl-gonl-gonl-af太高的gonl等位基因频率是
太高的gnomad等位基因频率太高的gnomad等位基因频率是
低的gq太低的gq对索引样本的gq是
/>删除的等位基因唯一的alt等位基因是一个删除的等位基因;否####配置
过滤器的配置通过一个小的json文件。
请参见[此处](cfg/example filter.json)以获取示例。
--输出路径到输出(筛选)VCF文件的路径
[必需]
-t,--垃圾路径到垃圾VCF文件的路径[必需]
-p,--参数文件路径到筛选参数json的路径[必需]
--索引示例文本索引示例的名称[必需]
--立即返回/--没有立即返回
当
达到一个筛选器标准时立即将筛选器写入文件。default=true
--帮助显示此消息并退出。
````
\vtools stats
并将json写入stdout.
--输入文件输入VCF文件[必需]
--帮助显示此消息并退出。
```
\vtools gcoverage
这假设输入vcf文件至少与
gatk的gvcf文件相似。gvcf文件只需要一个样本;如果输入文件包含多个样本,我们只需获取第一个样本。
output是一个简单的tsv文件,包含以下列
/symbol/id
perc_u至少{10、29、30、50、90}外显子的gq值高于外显子的百分比
转录本转录名称/符号/id
*:通过首先计算所有gq
值的p值,然后计算这些p值的平均值来计算平均gq值,最后,将这个数字转换回一个分数。
--refflat文件路径refflat文件的路径[必需]
--每个exon/--每个转录本收集每个exon或每个转录本的度量值
--帮助显示此消息并退出。
````
vtools evaluate
evaluate VCF文件到基线VCF文件包含真正的积极因素。
我们只考虑两个VCF文件中存在的变体。这使得
当两个vcf文件由完全不同的
技术生成时非常有用。例如,当比较一个wes vcf文件和一个snp数组时,这个
工具非常适合我们ewel.
输出是一个简单的json文件,列出了一致和不一致等位基因的计数。
允许使用多样本vcf文件;必须通过cli参数设置要计算的样本。
[要求]
-p,正VCF路径路径到VCF,带有已知的调用[要求]
-CS,在调用VCF中调用样本文本样本(S)来考虑。可能是
称为多次[要求]
-PS,阳性样本文本(S)在阳性VCF中考虑。可能会多次调用[Required]
--帮助显示此消息并退出。
````
由于"v tools"名称已被另一个
包采用,因此安装此vtools需要安装以下内容:
``bash
pip install v-tools
````
编程式的
访问也只适用于
``python
import vtools
````