基于rwgk和支持向量机的蛋白质界面评分
iScore的Python项目详细描述
iscore
蛋白质构象排序的图核支持向量机
iscore提供了一个简单的解决方案,使用支持向量机方法对图核上的蛋白质-蛋白质界面进行分类。使用ISCORE的最简单的方法是通过专用二进制文件来隐藏方法的复杂性,并允许使用简单的命令行接口访问代码。这两个双星分别是iscore.train
和iscore.predict
,它们使用训练集训练模型,并使用该模型预测未知构象的近本征特征。
为了方便地使用这些二进制文件,建议使用以下文件结构:
root/
|__train/
| |__ pdb/
| |__ pssm/
| |__ caseID.lst
|__predict/
|__pdb/
|__pssm/
|__ caseID.lst (optional)
train
子目录包含训练集中包含的构象的pdb文件和pssm文件。可以使用pssmgenhttps://github.com/DeepRank/PSSMGen计算pssm文件。要训练模型,只需转到train
子目录并键入:
mpiexec -n ${NPROC} iScore.train
这个二进制文件将生成一个默认名为training_set.tar.gz
的存档文件,其中包含使用经过训练的模型预测测试集的二进制类所需的所有信息。要使用此模型,请进入test
子目录并键入:
mpiexec -n ${NPROC} iScore.predict --archive ../train/training_set.tar.gz
这个二进制文件将在文本文件iScorePredict.txt
中输出测试集中构象的二进制类和决策值。