2024-05-20 22:35:21 发布
网友
目前,我正在开发一个基于web的系统,它将存储自然复合信息。在这个系统中,有一个功能,用户可以输入smiles代码,系统将进行相似性或子结构搜索。在
然而,这个组织提供的数据中唯一有用的属性是smiles代码。我读过openbabel的东西,对我来说这是相当复杂的,因为我有有限的数据关于化合物。在
我的问题是
我们是否可以使用SMILES代码进行相似性或子结构搜索?在
是的,这是可能的,我建议使用RDKit来实现这一点,尽管我确信OpenBabel也会做得很好&{a1}
这些位通常是存储分子的索引,而不是存储在数据库中的完整分子索引:
from rdkit import Chem from rdkit.Chem import AllChem db_fingerprints = [AllChem.GetMorganFingerprintAsBitVect(Chem.MolFromSmiles(m), 2, nBits=1024) for m in db_smiles]
然后你可以用你的查询微笑来搜索这个数据库
这将输出一个相似性列表(与db_smiles的顺序相同)。必要时,你需要将这些相似之处旁边的微笑进行分类和压缩
db_smiles
是的,这是可能的,我建议使用RDKit来实现这一点,尽管我确信OpenBabel也会做得很好&{a1}
这些位通常是存储分子的索引,而不是存储在数据库中的完整分子索引:
然后你可以用你的查询微笑来搜索这个数据库
^{pr2}$这将输出一个相似性列表(与
db_smiles
的顺序相同)。必要时,你需要将这些相似之处旁边的微笑进行分类和压缩相关问题 更多 >
编程相关推荐