将SNP数组转换为VCF
array-as-vcf的Python项目详细描述
阵列作为VCF
array-as-vcf
是一个小型库和工具
将常见的SNP数组格式转换为VCF格式。在
当前支持四种数组格式:
- Affymetrix(TSV出口)
- 细胞扫描高清阵列(TSV导出)
- Lumi 317k阵列(TSV导出)
- Lumi 370k阵列(TSV导出)
- 多示例OpenArray(TSV导出)
不支持二进制格式。在
要求
- Python 3.6
- 请求
CLI使用
array-as-vcf
工具将把数组文件转换成VCF格式。
它将自动检测数组文件的类型,如果不能,则抛出一个错误
决定吧。在
生成的VCF文件被打印到stdout。在
必须提供要在VCF文件中使用的示例名称。在
如果没有lookup-table
,则从Ensembl查询REF和ALT等位基因
提供。这需要一个有效的互联网连接,而且速度可能相当慢
根据需要的HTTP请求量。在
当提供lookup-table
时,不会对rsid发出任何请求
它们存在于查找表中。查找表是一个JSON文件,
包含单个形状的大对象:
{"rs0":"{ref_allele}:{alt_alleles}:{ref_is_minor_allele}"}
例如
^{pr2}${{cd1}你以前不能运行{cd1}表
以及dump
生成的内部查找表,以供下一次迭代使用。在
Usage: array-as-vcf [OPTIONS] Options: -p, --path PATH Path to array file [required] -b, --build [GRCh37|GRCh38] -s, --sample-name TEXT Name of sample in VCF file -c, --chr-prefix TEXT Optional prefix to chromosome names -l, --lookup-table PATH Optional path to existing lookup table for rsIDs. -d, --dump PATH Optional path to write generated lookup table --help Show this message and exit.
- 项目
标签: