从电子显微镜结构中提取链

from Bio.PDB import PDBList, PDBIO, FastMMCIFParser, Select class ChainSelect(Select): def __init__(self, chain): self.chain = chain def accept_chain(self, chain): if chain.get_id() == self.chain: return 1 else: return 0 pdbl = PDBList() io = PDBIO() parser = FastMMCIFParser(QUIET = True) pdbl.retrieve_pdb_file('6kmw', pdir = '.', file_format='mmCif') structure = parser.get_structure('6kmw', '6kmw.cif') io.set_structure(structure) io.save('6kmw_aA.pdb', ChainSelect('aA'))

--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-5-095b98a12800> in <module> 18 structure = parser.get_structure('6kmw', '6kmw.cif') 19 io.set_structure(structure) ---> 20 io.save('6kmw_aA.pdb', ChainSelect('aA')) ~/miniconda3/envs/lab2/lib/python3.8/site-packages/Bio/PDB/PDBIO.py in save(self, file, select, write_end, preserve_atom_numbering) 368 ) 369 --> 370 s = get_atom_line( 371 atom, 372 hetfield, ~/miniconda3/envs/lab2/lib/python3.8/site-packages/Bio/PDB/PDBIO.py in _get_atom_line(self, atom, hetfield, segid, atom_number, resname, resseq, icode, chain_id, charge) 227 charge, 228 ) --> 229 return _ATOM_FORMAT_STRING % args 230 231 else: TypeError: %c requires int or char

1条回答

网友

1楼 · 发布于 2024-04-25 21:54:56

我认为，你想要达到的目标是不可能的。实际上，您希望将cif文件转换为pdb文件。在这个过程中，你想把蛋白质结构简化成单链并不重要。 PDB格式是上个世纪的文件格式。（我知道直到今天它的传播范围有多广…）它是面向列的，只允许链id使用一个字符。这就是您无法下载蛋白质6KMW的PDB文件的原因。请参见位于https://www.rcsb.org/structure/6KMW的工具提示：“PDB格式文件不适用于大型结构”。在你的例子中，“大”意味着蛋白质有如此多的链，它们需要两个字符

不能将两个字符存储为PDB文件的链名称。你现在有两个选择：

将链重命名为“aA”，并以PDB格式保存文件
不要使用PDB格式作为您的文件格式，而是坚持cif格式

此代码段重命名链并将结构存储为pdb文件：

[...]
io.set_structure(structure)
for model in structure:
    for chain in model:
        if chain.get_id() == "A":
            chain.id = "_"
            print("renamed chain A to _")
        if chain.get_id() == "aA":
            chain.id = "A"
            print("renamed chain aA to A")

io.save('6kmw_aA.pdb', ChainSelect('A'))

此代码段仅存储mmCIF格式的链“aA”：

from Bio.PDB.mmcifio import MMCIFIO

io = MMCIFIO()

io.set_structure(structure)
io.save("6kmw_aA.cif", ChainSelect('aA'))

相关问题更多 >

编程相关推荐

热门问题

热门文章