基于SMILES-cod的相似性搜索

2024-05-20 22:35:21 发布

您现在位置:Python中文网/ 问答频道 /正文

目前,我正在开发一个基于web的系统,它将存储自然复合信息。在这个系统中,有一个功能,用户可以输入smiles代码,系统将进行相似性或子结构搜索。在

然而,这个组织提供的数据中唯一有用的属性是smiles代码。我读过openbabel的东西,对我来说这是相当复杂的,因为我有有限的数据关于化合物。在

我的问题是

我们是否可以使用SMILES代码进行相似性或子结构搜索?在


Tags: 数据代码用户功能web信息属性系统
1条回答
网友
1楼 · 发布于 2024-05-20 22:35:21

是的,这是可能的,我建议使用RDKit来实现这一点,尽管我确信OpenBabel也会做得很好&{a1}

这些位通常是存储分子的索引,而不是存储在数据库中的完整分子索引:

from rdkit import Chem
from rdkit.Chem import AllChem
db_fingerprints = [AllChem.GetMorganFingerprintAsBitVect(Chem.MolFromSmiles(m), 2, nBits=1024) for m in db_smiles]

然后你可以用你的查询微笑来搜索这个数据库

^{pr2}$

这将输出一个相似性列表(与db_smiles的顺序相同)。必要时,你需要将这些相似之处旁边的微笑进行分类和压缩

相关问题 更多 >