vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。

abstar的Python项目详细描述


啊![](https://img.shields.io/pypi/v/abstar.svg?colorB=blue) [![生成状态](https://travis-ci.com/briney/abstar.svg?branch=master)](https://travis-ci.com/briney/abstar) [![文档状态](https://readthedocs.org/projects/abstar/badge/?version=latest)](https://abstar.readthedocs.io/en/latest/?徽章=最新) 啊![](https://img.shields.io/pypi/pyversions/abstar.svg) 啊![](https://img.shields.io/badge/license-MIT-blue.svg

#文章摘要

vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。

###安装 pip install abstar

###使用

要在单个fasta或fastq文件上运行abstar: abstar -i<input-file>-o<output-directory>-t<temp-directory>

要对输入目录中的所有文件迭代运行abstar,请执行以下操作: abstar -i<input-directory>-o<output-directory>-t<temp-directory>

要使用包含的测试数据作为输入运行ABSTAR: abstar -o<output-directory>-t<temp-directory>--use-test-data

当使用Abstar测试数据时,注意尽管测试数据文件包含1000个序列,但其中一个测试序列不是有效的抗体重组。只应成功处理999个序列。

使用basespace作为输入数据源时,可以选择提供所有必需的目录: abstar -i<input-directory>-o<output-directory>-t<temp-directory>-b

或者只需提供一个项目目录,所有必需的目录都将在项目目录中创建: abstar -p <project_directory> -b

###其他选项 -l LOG_LOCATION, --log LOG_LOCATION更改日志目录位置。默认为<output_directory>的父目录。

-m,--merge输入目录应包含成对的fastq(或gzip fastq)文件。配对文件将与pandaseq合并,然后再与abstar进行处理。注意,当使用basespace选项(-b,--basespace)时,此选项是隐含的。

-b,--basespace从基础空间(illumina的云存储环境)下载排序运行。由于illumina序列器产生成对的末端读取,因此暗示--merge

-u N, --uaid N序列包含长度为n的唯一抗体id(uaid,或分子条形码)。uaid将从每个输入序列的开头解析并添加到json输出中。负值会导致从序列末尾解析uaid。

-s SPECIES, --species SPECIES选择从中派生输入序列的种类。支持的选项有“human”、“mouse”和“macake”。默认为“人”。

-c,--cluster在芹菜集群上以分布式模式运行abstar。

-h,--help打印所有运行时选项的详细信息。

-D--debug更详细的日志记录。

###原料药 大多数核心的abstar函数都可以通过一个公共api获得,这使得作为集成分析管道的一个组件运行abstar变得更加容易。有关api的更多详细信息,请参阅abstar[文档](http://abstar.readthedocs.org)。

###帮助程序脚本 Abstar中包括一些帮助脚本: batch_mongoimport自动将多个json输出文件导入mongodb数据库。 build_abstar_germline_db从imgt-gapped-fasta的v、d和j基因片段文件创建abstar-germline数据库。 make_basespace_credfile为basespace生成一个凭据文件,如果使用abstar从basespace下载序列,则需要该文件。开发人员凭据是必需的,获取它们的过程[在这里](https://support.basespace.illumina.com/knowledgebase/articles/403618-python-run-downloader

###测试 要运行测试套件,请克隆或下载存储库并从顶级目录运行pytest ./

###要求 Python2.7,3.5+ 阿布蒂尔斯 生物疗法 芹菜 模拟(仅限Python2.7) nwalign3(用于python 2.7的nwalign) 皮蒙戈 比重瓶 scikit bio(对于python 2.7,<;=0.4.2)

以上所有依赖项都可以用pip安装,并在用pip安装abstar时自动安装。 如果您是python新手,一个很好的入门方法是安装[anaconda python发行版](https://www.continuum.io/downloads),其中包括pip以及大量有用的科学python包。

序列合并需要[pandaseq](https://github.com/neufeld/pandaseq) 批处理MongoImport需要[MongoDB](http://www.mongodb.org/) 下载basespace需要[basespace python sdk](https://github.com/basespace/basespace-python-sdk

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java应用程序不是在Eclipse中运行,而是在命令行中运行   swing Java图形组件问题。似乎找不到错误   我需要键盘。close();让代码正常工作?   Springboot中的java HttpSession   抽象语法树我想添加一个语句。我试图解析它,java解析器异常被抛出。如何克服它?   java Hibernate:清理会话   具有不连续子集的java划分问题   java正则表达式查找最后一个冒号后的字符串   java从SpringShell执行OS命令   Java扫描器字符串输入   java字符串索引越界异常(charAt)   java执行器服务终止被卡住   Springockito没有继承java@ContextConfiguration   java如何为一个servlet映射多个url   java安卓获取命令的stderr   java生成类型。表:数据库中的大数字   安卓 Getter Setter返回NothingJava