pyabpoa:基于自适应带的simdbase偏序对齐
pyabpoa的Python项目详细描述
pyabpoa:abPOA Python接口
简介
pyabpoa为abPOA提供了一个易于使用的接口,它包含所有api,可用于对一组序列执行MSA,并从最终的对齐图调用一致性。在
安装
使用pip
安装pyabpoapyabpoa可以与pip一起安装:
pip install pyabpoa
从源代码
安装pyabpoa或者,您可以从以下源安装pyabpoa:
^{pr2}$示例
下面的代码演示了如何使用pyabpoa。在
import pyabpoa as pa
a = pa.msa_aligner()
seqs=[
'CCGAAGA',
'CCGAACTCGA',
'CCCGGAAGA',
'CCGAAGA'
]
res=a.msa(seqs, out_cons=True, out_msa=True, out_pog='pog.png') # perform multiple sequence alignment
# generate a figure of alignment graph to pog.png
for seq in res.cons_seq:
print(seq) # print consensus sequence
res.print_msa() # print row-column multiple sequence alignment in PIR format
您也可以尝试源文件夹中提供的示例脚本:
python ./python/example.py
原料药
班级pyabpoa.msa_校准工具
pyabpoa.msa_aligner(aln_mode='g', ...)
这构造了一个pyabpoa的多序列对齐处理程序,它接受以下参数:
- aln\u mode:对齐模式。'g':全局,“l”:本地,“e”:扩展;默认值:'g'
- match:匹配分数;默认值:2
- gap_open1:第一个间隙打开惩罚;默认值:4
- gap_ext1:第一个间隙扩展惩罚;默认值:2
- gap_open2:第二个间隙打开惩罚;默认值:24
- gap_ext2:第二个间隙扩展惩罚;默认值:1
- extra_b:第一个自适应分带参数;设置为<;0以禁用自适应分带DP;默认值:10
- extra_f:第二个自适应条带paremet;在带的两个位点上添加的额外碱基的数目是b+f*L,其中L是对齐序列的长度;默认值:^{str1}$0.01
- 是二倍体:如果输入是二倍体数据,则设置为1默认值:0
- min_freq:为二倍体数据输出每个共识的最小频率默认:0.3
msa_aligner
处理程序提供了一个方法,该方法执行多个序列对齐并接受四个参数:
pyabpoa.msa_aligner.msa(seqs, out_cons, out_msa, out_pog=None)
- seqs:包含一组输入序列的列表变量;positional
- ^{str{str}a positional}生成一致性
- out_msa:一个bool变量,用于请求pyabpoa生成RC-msa;positional
- out{pog:存储最终对齐图绘图的文件名(
.png
或.pdf
),默认值:None,默认值:None
班级pyabpoa.msa_结果
pyabpoa.msa_result(seq_n, cons_n, cons_len, ...)
此类描述生成的一致性序列和RC-MSA的信息。pyabpoa.msa_aligner.msa()
的返回结果是此类的一个对象,具有以下属性:
- seq_n:输入对齐序列数
- cons\n:生成的一致序列数(通常为1,如果输入指定为二倍体,则可以为2)
- cons\u len:一致序列长度的数组
- cons\seq:一致序列的数组
- msa_len:RC-msa中每行的大小
- msa-seq:一个数组,包含演示RC-msa的
seq_n
字符串,每个字符串由一个输入序列和几个表示对齐间隔的-
组成。在
pyabpoa.msa_result()
有一个功能print_msa
,它将RC-MSA打印到屏幕上。在
pyabpoa.msa_result().print_msa()
- 项目
标签: