pitools:一个python程序,用于阶段化和插补数据。

pitools的Python项目详细描述


简介

pitools是ngs数据的分阶段和插补工具,它是 插补服务器核心:https://imputation.cngb.org/。你可以用皮托 作为本地Linux集群中自己的插补管道。

快速启动

pitools使用eagle进行相位调整 以及Minimac3的责任。

安装

通过pip安装发布的版本:

pip install pitools

或者您可能希望从github安装开发版本, 通过运行:

pip install git+git://github.com/ShujiaHuang/pitools.git#egg=pitools

此命令将在系统中安装pitools,您可以在 你的命令。

使用量

您可以通过运行 pitools impute --help

usage: pitools impute [-h] -C CONFIG [-M IMPUTE_METHOD] [-P PHASE_METHOD] -I IN_VCF
                 -O OUT_PREFIX --refpanel-version REFPANEL --reference-build
                 REFBUILD [--unprephase] [--regions chr:start-end]
                 [--nCPU NCPU]

optional arguments:
  -h, --help            show this help message and exit
  -C CONFIG, --conf CONFIG
                        YAML configuration file specifying details information
                        for imputation
  -M IMPUTE_METHOD, --methods IMPUTE_METHOD
                        Tool for imputation. [minimac]
  -P PHASE_METHOD, --prephase-method PHASE_METHOD
                        Tool for pre-phase before imputation. [eagle]
  -I IN_VCF, --input IN_VCF
                        Input one VCF file to analyze. Required
  -O OUT_PREFIX, --outprefix OUT_PREFIX
                        Prefix for output files. Required
  --refpanel-version REFPANEL
                        The version of haplotype data for reference panel.
                        Required
  --reference-build REFBUILD
                        The build version of reference, e.g: GRCh37
  --unprephase          Do not perform pre-phased before the imputation
                        process.
  --regions chr:start-end
                        Skip positions which not in these regions. This
                        parameter could be a list of comma deleimited genome
                        regions(e.g.: chr:start-end,chr:start-end)
  --nCPU NCPU           Number of threads. [1]

配置文件

pitools需要一个用于设置阶段化路径的配置文件 程序,插补程序,参考版本和参考小组。 下面是如何创建配置文件的示例之一: config.yaml

现在您可以使用pitools作为强大的插补管道,一旦您 已经完成设置。

示例

这个命令足够你做大部分工作了。

pitools impute -C config.yaml \
    -I your.vcf.gz \
    -O test_outprefix \
    --refpanel-version 1000G_P3_GRCh37 \
    --reference-build GRCh37 \
    --nCPU 4

如果你只想在某个特定的 区域。下面是在基因组区域运行pitools的示例: 21:38347375-3850073122:17203103-17439826

pitools impute -C config.yaml \
    -I your.vcf.gz \
    -O test_outprefix \
    --refpanel-version 1000G_P3_GRCh37 \
    --reference-build GRCh37 \
    --regions  21:38347375-38500731,22:17203103-17439826 \
    --nCPU 4

PI将在执行插补之前自动执行预相位 过程。但有时你的输入VCF文件已经分阶段了。以及 您不想再运行它,然后可以设置--unprephase 参数跳过该过程。

pitools impute -C config.yaml \
    -I your.vcf.gz \
    -O test_outprefix \
    --refpanel-version 1000G_P3_GRCh37 \
    --reference-build GRCh37 \
    --unprephase \
    --nCPU 4

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何在java swing表单配置文件中显示动态布局   swing Java使用GridLayout和鼠标交互式JPanel创建JFrame   java使用jsp dao和servlet从数据库中的4行中只插入几行   java SqlLite:我们可以选择行作为列吗?   启动glassfish服务器时java获取错误   PersistenceUnit的java部署[…]失败。关闭此PersistenceUnit的所有工厂   java将具有多个关系的实体与集合中的任何元素进行匹配   java对命名模式的建议,该模式在op失败时尝试强制转换返回null   使用jtwitter的java安卓抛出错误   使用Java方法查找数组中最小int的位置   SwingJava。网络气球提示没有出现   java无法使用JavaMail api发送邮件   java HashSet contains()为自定义对象返回false。hashCode()和equals()似乎实现正确   Java:在运行时和编译时向类中添加字段?   java正在服务类中导入jersey和JAXR,这被认为是错误的做法