共识多重对齐(CMA)文件格式的I/O和实用程序。
biocma的Python项目详细描述
一致多对齐格式,使用Biopython对齐。
一致性对齐格式(CMA)的I/O支持和相关功能。 此格式表示蛋白质序列比对。它被一些工具使用 安德鲁·诺瓦德博士,尤其是CHAIN和MAPGAPS。
在可能的情况下使用biopython对象和约定。
安装
这是一个普通的python包。您可以使用 setup.py脚本:
python setup.py build python setup.py install
稳定的版本也会上传到pypi,这样你就可以用 python包管理器:
pip install biofrills
或:
easy_install biofrills
我发现一些有用的脚本位于scripts/目录中。默认情况下,这些 未安装,但可以通过取消对setup.py中的行的注释来包含它们。 从scripts=glob…
开始或者,您可以将这些脚本复制到 $PATH。
CMA格式对我有什么帮助?
- 像A2M和斯德哥尔摩的格式一样,对齐显示为 小写字符和删除是破折号
- 与A3M格式一样,路线是成对的,而不是一个轮廓(或“一致性”)。 序列),它还指示哪些站点是indel。通过压缩 插入列,许多发散(但相关)序列的大量对齐 不需要填充就可以显示出来,就像斯德哥尔摩那样,大部分都是空白字符。
- 像斯德哥尔摩,但不像A2M和A3M,不止一条线路可以 包含在单个文件中。
- 通常,未加修饰的共识序列将作为第一个 序列。
- 类似fasta的头包含额外的可选字段,用于 领先和落后的网站和nbci分类代码
谁使用CMA?
CMA格式似乎是由 马里兰大学,用于这些项目:
我应该在自己的工作中使用cma吗?
除非您使用的是MapGaps或Chain,否则不行。