帮助识别变量调用文件中假阳性变量的一组工具。
extremevariantfilter的Python项目详细描述
极值过滤器
extreme variant filter是一套基于xgboost的工具,用于帮助识别基因组变体调用文件中的假阳性变体。
功能
应用过滤器
Usage:
apply_filter (--vcf STR) (--snp-model STR) (--indel-model STR) [--verbose]
Description:
Apply models generated by train_model to a VCF.
Arguments:
--vcf STR VCF to be filtered
--snp-model STR Model for applying to SNPs
--indel-model INT Model for applying to InDels
Options:
-h, --help Show this help message and exit.
-v, --version Show version and exit.
--verbose Log output
Examples:
apply_filter --vcf <table> --snp-model <snp.pickle.dat> --indel-model <indel.pickle.dat>
train_模型
Usage:
train_model (--true-pos STR) (--false-pos STR) (--type STR) [--out STR] [--njobs INT] [--verbose]
Description:
Train a model to be saved and used to filter VCFs.
Arguments:
--true-pos STR Path to true-positive VCF from VCFeval or comma-seperated list of paths
--false-pos STR Path to false-positive VCF from VCFeval or comma-seperated list of paths
--type STR SNP or INDEL
Options:
-o, --out <STR> Outfile name for writing model [default: (type).filter.pickle.dat]
-n, --njobs <INT> Number of threads to run in parallel [default: 2]
-h, --help Show this help message and exit.
-v, --version Show version and exit.
--verbose Log output
Examples:
train_table --true-pos <path/to/tp/vcf(s)> --false-pos <path/to/fp/vcf(s)> --type [SNP, INDEL] --njobs 20
安装
要安装并运行evf,只需键入:
pip install extremevariantfilter
或者,克隆此repo并使用以下命令生成:
git clone https://github.com/stLFR/extremevariantfilter.git
cd extremevariantfilter
pip install .
stlfr纸张结果
如果你想用这个工具来证实
stLFR Paper on Bioarxiv纸张,
用于变量筛选的模型在models/
目录中可用。
为了得到相同的结果,在安装之后,使用命令
pip install -r requirements.txt
以确保
环境与我们用于结果的环境匹配。
某些包的不同版本将导致不同的结果。