Traitar-微生物特性分析仪

traitar的Python项目详细描述


Traitar–微生物特性分析仪

Traitar是一个用于描述 核苷酸或蛋白质序列。它能准确地表现出67种不同的表型。 特征

目录

< div >
安装
基本用法
结果
引用traitar

安装

有关安装说明,请参见安装说明。

基本用法

traitar表型<;in dir>;<;样本文件>;来自核苷酸<;out dir>;

将触发traitar的标准 工作流 ,即预测打开 用浪子读取帧,注释提供的编码序列 pfam家系所有样本中的核苷酸fastas 最后根据67个性状的模型预测表型。

示例文件有一列用于示例文件名,另一列用于 由用户指定的名称。您还可以指定 第三列中的样本,将显示在生成的绘图中。 模板如下-标题行是必需的;请 还要查看打包示例数据的示例文件:

< div >
示例文件{tab}示例名称{tab}类别
样本文件名{tab}样本名称{tab}样本类别1] 样本2文件名{tab}样本2名称{tabl}样本类别2]

traitar表型<;in dir>;<;样本文件>;来自_genes<;out_dir>;

假设基因预测已经在外部进行。在 这个案例分析将从pfam注释开始。如果输出 目录已经存在,traitar将提供重新计算或恢复 个别分析步骤。此选项仅在进程 以交互方式运行。

并行使用

traitar可以从并行执行中获益。参数集 使用的进程数,例如使用两个进程的 -c 2

traitar表型<;in dir>;<;样本文件>;从_核苷酸输出_dir -c 2

这需要按照上述说明安装GNU并行。

检查表型分类模型

traitar可以用来检测每个表型的蛋白质家族 型号:

Traitar Show‘葡萄糖发酵罐

将显示大多数功能,即贡献 利用phypat 一些基因组序列的分类器。VIA–用户可以指定的预测器 分类器(phypat,phypat+pgl)。

使用打包的示例数据运行traitar

traitar表型 <;traitar-dir>;/数据/样本数据 <;traitar-dir>;/数据/样本数据/samples.txt 来自基因<;out-dir>; -c 2 会引起灰李斯特菌和李斯特菌的表型 伊万诺维WSLC3009 。计算应在5分钟内完成。你可以 运行

```蟒蛇 python>;>>导入traitar>;>>traitar。 路径 ````

结果

特拉塔尔省基因预测结果 <;out_dir>;/基因预测中的pfam注释 <;out_dir>;/pfam_注释和表型预测 in <;out-dir>;表型预测

热图

表型预测在热图中分别总结为 热图phypat.png中的种类模式分类器,用于 在 heatmap_phypat_ggl.png中对系统发育敏感的分类器 分类器 组合在 heatmap_comb.png中并提供层次结构 表型和样本的聚类树状图。

表型预测-表格和平面文件

这些热图基于制表符分隔的文本文件,例如 预测-多数票组合.txt 。否定的预测是 编码为0,仅由纯种类分类器 1,一个由系统发育感知分类器2和一个预测 两种算法都支持3。 预测结果是统一的,多数票是统一的。txt提供了统一的版本 每行有一个预测。专家用户也可以 希望访问 相应的子文件夹 phypat phypat+pgl

表型相关蛋白家族和特征轨迹

traitar将蛋白质家族和预测的表型联系起来。这个 结果可在 phypat/feat\gffs 和 ` phypat+pgl/feat-gffs 。如果用户选择了"来自核苷酸" 选项,traitar还将生成gff文件,链接名为 与重要的蛋白质家族一起生产。表型特异性 蛋白质家族注释轨迹可以通过 基因组浏览器的选择。

带有 from_genes 选项的特征轨迹(实验特征)

如果设置了from_genes选项,用户可以指定gene gff文件 通过示例文件中名为gene_gff的附加列。作为基因 不同来源的基因gff之间的ids不一致,例如img, refseq或prodigal用户需要指定基因gff的来源 文件通过-g/-gene-gff-u类型参数。仍然没有 保证目前有效。使用samples_gene_gff.txt作为 上述示例中的示例文件将生成特定于表型的pfam 两个基因组的轨迹。

traitar表型。从"基因traitar"中提取的样本"gene"gff.txt -g refseq

码头工人

有一个码头集装箱可供Traitar使用。拉开

docker拉aweimann/traitar

要为示例数据运行traitar,请执行

docker run -v <;traitar-dir>;data/sample-data:/mnt &1445e6c1992 bash -c 'traitar表型/mnt//mnt/samples.txt来自于核苷酸/mnt/traitar-out'

大约需要30分钟。注意并行使用有问题 所以-c选项不能保证有效。产出将归 根。所以目前你仍然需要根访问你的机器来检查 traitar_out文件夹。

引用traitar

如果您在研究中使用Traitar,请引用我们的预印本:

< div >
从基因组到表型:traitar,微生物性状分析仪 亚伦·魏曼,杰里米·弗兰克,菲利普·波普,安德烈亚斯·布雷姆格斯,爱丽丝·C 妇幼保健院种类
biorxiv (2016)内政部:10.1101/043315 rel="nofollow">10.1101/043315

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpring重定向请求处理程序   SwingJava:拆分字符串并将其放入文本区域的   Java:标记“”上出现语法错误,此标记后面应为表达式   web服务Java RestService从日志文件写入和读取数据   java如何将ArrayList<String>转换为char数组,然后向后打印每个单词?   java SimpleDataFormat解析返回年终日期   加密Java aes解密bytebuffer,包括填充为空字节   java有没有办法从特定的if语句调用变量?   java从更新返回到渲染   spring GRPC Java登录测试   java为什么下面的代码不工作(StringBuffer.toString!=null)   java是一种可行的模式吗?   使用Spring集成测试的JavaOSGi片段   java jCommander为未知和未使用的值引发异常?   在imageView的editText中输入的java图像URL