构建蛋白质数据库(PDB)文件
我需要建模一个复杂的聚合物,主要成分是赖氨酸。它看起来像蛋白质,但赖氨酸不一定总是和它的α氨基结合在一起。我的目标是生成一个PDB(蛋白质数据银行)文件,以便进行进一步的计算。
你知道有什么模块可以让我构建分子吗?我有一些特别的需求,比如:
- 我有一串氨基酸
- 我需要在这串氨基酸中再添加一个
- 但我必须能够指定这个新加的氨基酸和前一个氨基酸的结合位置和方式
- 最后,我需要能够生成一个PDB文件
我最开始尝试使用SMILES格式,所有操作都很顺利,除了最后无法生成PDB文件,因为没有软件能处理我这个数量的原子(超过15000个)。
3 个回答
你可以在pymol中把氨基酸和蛋白质中选中的原子叠加在一起,这样就能制造一个人工的连接。具体可以参考这个链接 - https://pymolwiki.org/index.php/Pair_fit
- 然后把它导出为一个 .pdb 文件
在配对之前,你可以先随意调整分子的位置。
我知道有两个比较不错的模块:
pdb-tools
pdbTools 是一组命令行的 Python 脚本,用来处理 wwPDB 的蛋白质和核酸结构文件。市面上有很多程序,无论是开源的还是商业的,都能完成类似的任务;不过大多数这些工具都隐藏在功能更复杂的程序里。因此,进行一些相对简单的计算时,往往需要学习一个新程序、编译模块和安装库。为了填补这个空白(并完成我需要做的任务),我开始编写自己的工具集。这逐渐演变成了 pdbTools 套件。这个程序套件有以下几个特点:
- 每个程序都应该能独立运行,并且有一个标准的 GNU/POSIX 风格的命令行界面。
- 每个程序都应该写得可以作为更复杂程序的函数库来使用。
- 程序应该尽量减少对外部依赖的要求。
biopython
Biopython 项目是一个国际开发者协会,致力于提供免费的 Python 工具,用于计算分子生物学。
好的,我终于找到了解决我问题的方法,虽然这跟我最开始的问题没什么关系。我还是按照最初的思路,用一个Python脚本生成了一个很长的SMILE链。然后,我终于找到了一款能够转换这么长链的软件:Discovery studio visualizer。
我觉得它能工作是因为这个软件不是基于openbabel的。虽然这不是一个Python的解决方案,但它确实能完成任务。
无论如何,还是谢谢你们。