用python(蛋白质结构文件)解析PDB头信息?

2024-06-16 08:25:46 发布

您现在位置:Python中文网/ 问答频道 /正文

PDB文件(蛋白质数据库)是否有解析器可以从header/REMARK部分提取(大多数)信息,比如精化统计等等。?在

值得注意的是,我主要感兴趣的是在文件生成后立即访问数据,而不是从已经存入蛋白质数据库的结构。这意味着要处理的“适当”格式有很多种,这取决于所使用的优化软件。在

我已经看过Biopython,但他们在FAQ中明确指出:“如果您对PDB头的数据挖掘感兴趣,您可能需要查找其他地方,因为对此的支持非常有限。”

我很清楚,从mmCIF文件中提取这些信息要容易得多,但不幸的是,这些信息还没有从许多大分子晶体学程序中常规输出。在


Tags: 文件数据信息数据库解析器软件格式蛋白质
2条回答

到目前为止,我发现的最好的方法是使用PDB_extract(http://pdb-extract.wwpdb.org/,联机或独立)将PDB文件转换为mmcif格式。

可以使用Biopythons解析mmcif文件生物数据库-模块。 编写mmcif文件有点困难,Python PDBx似乎工作得相当好。

这个和其他有用的PDB-/mmcif工具可以在http://mmcif.wwpdb.org/docs/software-resources.html找到

也许你该去图书馆看看? https://pypi.python.org/pypi/bioservices

相关问题 更多 >