抗体库的质量控制管道

abseq的Python项目详细描述


目录

简介

abseq

abseq是一个全面的生物信息管道,用于分析抗体库生成的测序数据集,abseqpy是其软件包之一。给定fastq或fasta文件(成对或单端),abseqpy生成clonotypes表v-(d)-j germline注释函数速率,以及 CSV和HDF文件组合中的多样性估计。抗体库的更专业化分析 像引物特异性序列模体分析限制性位点分析也在列表中。

此程序将与abseqr一起使用, 由abseqpy生成的数据的报告和统计分析包。尽管abseqpy在没有abseqr的情况下工作正常,但强烈建议用户也安装r包,以便利用管道的交互式html报告功能。abseqr的项目页面显示了分析类型abseq所提供的一些示例;完整的文档可以在abseqr的vignette中找到。

开发人员

  • abseq由Monther Alhamdoosh和Jiahong Fong开发
  • 有关意见和建议,请发送电子邮件至m.hamdoosh<;at>;gmail<;dot>;com

先决条件

abseqpy依赖于一些外部软件来工作,它们应该是正确的 在运行abseqpy之前安装并配置 < Buff行情>

abseqpy在Python2.7上运行。python 3.6支持正在进行中。

无缝安装依赖项

这是安装abseqpy外部依赖项的建议方法。

python脚本可以在这里下载并安装所有必需的外部依赖项。

此脚本假定以下内容已可用:

  • perl
  • git
  • 巨蟒
  • 一个HReF= ="HTTP://www. Oracle .COM/TeaTeWorks/Java/JavaSe/DeLosis/JRe8下载-2133155.HTML"Re="NoFoLoLy"> JavaJRE 版本1.6或更高
  • < HRIF= ="HTTPS://Gcc.GNUORG/Re="NoFoLoL> C/C++编译器< /A>(Windows不需要)
  • 制作。(Windows不需要)
  • cmake(Windows不需要)

将外部依赖项安装到名为~/.local/abseq

$ mkdir -p ~/.local/abseq
$ python install_dependencies.py ~/.local/abseq
< Buff行情>

此脚本不会安装abseqpy本身,只安装其外部依赖项。

此脚本适用于Python2和3,并且~/.local/abseq可以替换为任何目录。 然而:

  • 此目录将保留,请明智地选择
  • 安装脚本将转储此目录中的二进制文件,它将包含数据库和内部文件

一旦安装成功,系统会在屏幕上提示用户 更新环境变量,使其包含~/.local/abseq

中安装的依赖项。

手动安装依赖项

本节适用于以下情况:

  1. 发现安装脚本失败
  2. 感到冒险

有关详细指南,请参阅本文档。

abseqpy安装

本节演示如何安装abseqpy

从pip安装
$ pip install abseqPy

从源安装

$ git clone https://github.com/malhamdoosh/abseqPy.git
$ cd abseqPy
$ pip install .
$ abseq --version

abseq命令现在应该可以在命令行上使用。

< Buff行情>

安装abseqpy也安装其他python包,考虑使用python虚拟环境来防止 重写现有包。请参见virtualenv 或conda

用法

基本用法

要启动并运行,以下命令通常就足够了:

$ abseq -f1 <read1> -f2 <read2> -o results --threads 4 --task all

-f2仅在成对末端测序实验时才需要。

高级用法

除了使用命令行选项调用abseq之外,abseq还支持-y<;file>;-yaml<;file>; 读取文件中定义的参数。这样可以同时分析多个样本,每个样本 具有共享或独立的abseq参数。

文件的基本yaml语法是键:val其中键是abseq "long"选项(所有"long"选项名称请参见abseq--help)和 val是提供给"long"选项的值。相继指定了其他样本 由三个破折号分隔--

示例

假设名为example.yml的文件具有以下内容:

# sample one, PCR1name:PCR1file1:fastq/PCR1_R1.fastq.gzfile2:fastq/PCR1_R2.fastq.gz---# sample two, PCR2name:PCR2file1:fastq/PCR2_R1.fastq.gzfile2:fastq/PCR2_R2.fastq.gzbitscore:300# override the defaults' 350 for this sample onlytask:abundance# override the defaults' "all" for this sample onlydetailedComposition:~# enables detailedComposition (-dc) for this sample only---# more samples can go here---# "defaults" is the only special key allowed.# It is not in abseq's options, but is used here# to denote default values to be used for ALL samples# if they're not specified.defaults:task:alloutdir:resultsthreads:7bitscore:350sstart:1-3

然后执行abseq-y example.yml相当于同时运行 abseqdefaults字段中的参数应用于两个示例。这里有一个 等效值:

$ abseq --task all --outdir results --threads 7 --bitscore 350 --sstart 1-3 \
>   --name PCR1 --file1 fastq/PCR1_R1.fastq.gz --file2 fastq/PCR1_R2.fastq.gz
$ abseq --task abundance --outdir results --threads 7 --bitscore 300 --sstart 1-3 \
>   --name PCR2 --file1 fastq/PCR2_R1.fastq.gz --file2 fastq/PCR2_R2.fastq.gz \
>   --detailedComposition 

建议使用--yaml,因为它是自文档的、可复制的和易于运行的。

有问题

  1. 在上面的示例中,在example的默认值键中指定线程:7。yml将使用 7个线程,即,abseqpy将运行7个*示例数总进程。

帮助

在命令行中调用abseq-h将显示选项abseqpy使用。

支持的平台

abseqpy适用于大多数Linux发行版、Mac OS和Windows。

由于软件不兼容,某些功能在Windows中运行时被禁用,它们是:


<;small>;1<;/small>;<;small>;长选项名称是带有双短划线前缀的选项名称,例如, --help是一个长选项,而-h不是

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在Android Wifi中筛选相同的SSID?   Java中重写接口中异常处理的泛型   java“无效转义序列(有效的是\b\t\n\f\r\”\“\”\)”语法错误   使用JNDI的java NameReadyBoundException   java如何在这个程序上执行算法   java为什么我的应用程序在调试时崩溃而应用程序停止?   Java:while循环未检测到中断条件,但如果块检测到   java如何快速使用jfreechart创建的折线图   java将输入放入JSTL会话变量,以便稍后在屏幕上显示   java在spring boot中加载外部JAR   java Apache NiFi无法使用ojdbc6连接到Oracle 12c。jar或ojdbc8。罐子   java解释StringToWordVector()Weka的输出   java charAt()找不到符号   使用mpjexpress的java阅读控制台输入