组合变异效应预测因子
CombiVE的Python项目详细描述
先决条件
- python 2.7版
- 管道(http://pypi.python.org/pypi/pip)
- 纽比(http://pypi.python.org/pypi/numpy)
- matplotlib(http://matplotlib.org)
安装
要安装此模块,请运行以下命令:
sudo python setup.py install
下载参考数据库
安装完成后,键入
CombiVEP_reference_updater
此应用程序将自动检查ucsc和ljb数据库,并查看 如果需要下载新的。原始数据库大小为 每个大约1GB。每个数据库的总操作时间应为 大约30-60分钟。
培训
在安装了参考数据库之后,可以训练combivep模型 使用
CombiVEP_trainer <training_data_file>
<;training_data_file>;必须采用CBV格式:chrom、pos、ref、alt, 实际有害影响。每个字段由一个制表符分隔。SNP位置(POS) 是基于1的索引。CBV格式的Varibench培训数据文件可在
combivep/data/CBV/training.cbv
预测
要使用经过训练的模型来预测效果,可以使用
CombiVEP_predictor <input_file> [-F FORMAT]
输入文件可以是VCF或CBV以上格式。默认值为 VCF格式。因此,如果要使用VCF格式的输入文件,只需键入
CombiVEP_predictor <vcf_file>
如果要使用CBV格式的文件进行预测,可以
CombiVEP_predictor <cbv_file> -F CBV
CBV格式的变量测试数据文件可在
combivep/data/CBV/test.cbv