proteinko用于模拟蛋白质的物理化学性质分布
proteinko的Python项目详细描述
proteinko
proteinko用于模拟 蛋白质。
关于
蛋白质是一系列氨基酸残基,每一个残基的特征是 物理和化学性质。 通过模拟单个氨基酸残基的特性,将它们映射到 表示蛋白质序列并求和重叠的单个载体 部分模拟氨基酸残基,proteinko产生分布 蛋白质序列的物理化学性质。
proteinko具有用于以下属性的内置模式,尽管它允许 为氨基酸的任何真实或理论性质添加自定义模式 残留物:
- 水疗
- 施主氢键
- 受主氢键
- 等电点
- 范德瓦尔斯音量
安装
pip install proteinko
使用量
首先,我们将从proteinko
导入名为proteinko的类
打包并初始化类的实例。
fromproteinkoimportProteinkoprt=Proteinko()
为了列出可用的物理化学特性,我们可以使用内置方法
get_schemas()
。这将产生以下输出。
schemas=prt.get_schemas()print(schemas)>>>['hydropathy','acceptors','donors','pI','volume']
这看起来不错,但是让我们添加一个自己的模式。我们要用
Kyte Doolitt水疗模式,存储在本地的CSV文件中
resources/
目录。
prt.add_schema('resources/kyte_doolittle.csv',amino_col=0,value_col=1,key='kd',header=1)
为了澄清我们在这里做了什么,我们将路径传递到csv文件,指定 含有氨基酸残基和相应值的色谱柱, 提供一个密钥,在该密钥下存储数据并让解析器知道 文件有一个标题行。现在如果我们打印模式,我们应该看到 输出。
print(prt.get_schemas())>>>['hydropathy','acceptors','donors','pI','volume','kd']
最后,为了得到凯尔特杜利特水疗的分布
蛋白质序列,首先定义我们的蛋白质序列,然后调用
函数get_dist()
将序列和模式作为函数参数传递。
sequence='ILKEPVHGV'dist=prt.get_dist(sequence,'kd')
如果我们绘制我们的模型分布,它应该看起来像这样。