对来自体细胞VCF的生殖系呼叫进行加密过滤。
GermlineFilter的Python项目详细描述
germline filter是一个python程序,用于icgc-tcga梦想突变调用挑战,旨在为真正的数据安全措施做出贡献。它以gatk生成的预处理和加密的germline调用文件和体细胞snv vcf文件作为输入,并返回体细胞vcf中的germline调用数。
特点:
- germlinefilter最重要的特性是程序以加密的方式运行,使其在任何服务器上运行都是安全的。流程图中描述的所有过滤步骤都是在运行时完成的,在任何时候数据都不会写入磁盘。它有三个选项:
- encrypt_germline_vcf-加密truth germline vcf(上面工作流中的预处理步骤)
- filter-根据加密的真生殖系vcf过滤体细胞vcf。这一步是以加密的方式完成的。
- get_germline_positions-获取在体细胞vcf中调用的实际生殖系位置。这一步是以一种未经加密的方式完成的,与原始的真话germline vcf相反。它只能在本地或加密服务器上运行。输出将写入制表符分隔的文件。
- 多个germline vcf可以同时进行预处理,使用一个通用的salt文件和密钥文件。
- 多个体细胞VCF对应于同一个加密的真生殖系文件可以同时过滤。与单独跑步相比,这大大提高了速度。
- 用户可以选择加密协议(aes、blowfish);默认aes
- 用户可以选择哈希协议(md5或sha512);默认sha512
- 获取VCF中的实际生殖线位置,以便绘制和进一步分析。
用法:
安装后,要了解如何使用细菌过滤器,请运行:
germline_filter --help
有关更多示例,请查看位于<;path to dir>;/germlinefilter-1.2/doc中的用户手册