用于处理变量调用格式文件的工具。
vcftoolz的Python项目详细描述
用于处理变量调用格式文件的工具。
VCF TOOLZ是由美国食品公司开发的 以及药品管理局,食品安全和应用营养中心。
- 免费软件
- 文档:https://vcftoolz.readthedocs.io
- 源代码:https://github.com/CFSAN-Biostatistics/vcftoolz
- pypi分布:https://pypi.python.org/pypi/vcftoolz
功能
- 比较两个或多个VCF文件中的SNP。
- 列出每个vcf文件唯一的snp,每个snp包含完整的基因型信息。
- 列出每个VCF文件中缺少的SNP(如果至少存在于其他两个VCF文件中)。
- 生成vcf文件中位置和snp的venn图。
- 当知道真相时,报告精确性、召回率和F1分数。
- 当知道真相时,报告过滤变量的有效性。
- 将VCF文件重新格式化为高窄格式,以便于查看和区分。
- 统计样本、位置、调用、snp、indel、其他变量、丢失的调用和筛选原因。
- 沿着基因组的长度绘制调用并显示过滤调用的位置。
许可证
请参阅vcf toolz发行版中包含的许可证文件。
历史
1.2.0(2019-04-04)
- 修正窄命令错误打印alt=的缺陷。当gt=时。
- 添加count命令来计算样本、位置、调用、snp、indel, 其他变体、筛选的调用、丢失的调用和筛选原因。
- 添加plot命令以沿着基因组长度绘制调用并显示 已筛选呼叫的位置。
- 将比较报告的文本更改为引用“calls”,而不是“sample snps”。
- 放弃对python 3.4的支持,matplotlib不支持它。
- 添加对Python3.7的支持。
1.1.1(2019-03-26)
- 打印调用数据时,将“无”替换为“.”。
- 支持每个位置有多个替代等位基因的VCF文件。
1.1.0(2019-02-06)
- 支持读取gzip压缩的vcf文件。
1.0.0(2018-11-20)
- 首次公开发行。