该项目旨在通过复合蛋白质相互作用来训练神经网络,并通过交互式地显示转化的化学景观和感兴趣的化学物质的可视化合成孔径雷达来解释所学习的模型。
visar的Python项目详细描述
visar
visar:一种交互式工具,用于剖析由深部神经网络qsar模型学习的化学特征
丁庆阳、侯思宇、祖松鹏、张永辉、邵莉
清华大学综合与系统生物学系生物信息学教研室,中国北京100084
清华大学药学院,北京100084, 中国.<
如果您有任何疑问或建议,请联系dingqy14@mails.tshunga.edu.cn。
目录
- 本项目的目标
- 工作流程
- 使用说明
本项目的目标
(返回到目录)
虽然之前的许多工作都集中在改进模型的预测优点上,但很少有人研究经过训练的模型,检查模型是否在学习真正重要的东西,并将模型所学的东西与有用的见解联系起来。
在这里,我们进一步解释了从深部神经网络qsar模型中学习到的特征,并提出了visar,一个基于学习到的特征可视化结构-活动关系和化学活动景观的交互式工具,从而提供了对神经网络的更深入的见解。AL网络"黑匣子"。 对于学习任务,visar首先为用户提供了建立、训练和测试深层神经网络模型的有用功能。
visar工作流程的基本原理如下图所示:
visar从神经网络qsar模型的一系列训练权值出发,提供了从3个层次上剖析所学化学特征的可视化工具:1)在宏观层次上,将具有权值特征的化合物进行聚类,形成不同的化学景观。不同的任务;2)在中尺度上,在化学景观上具有相似结构和相似活性的每一个局部化学簇内,可以识别出药效特征;3)在微观层次上,针对每一个任务为每一个化合物建立sar模式。
Visar工作流功能:
- 对于学习任务,visar首先为用户提供了建立、训练和测试神经网络模型的有用功能。
- 然后将模型的学习参数映射回每个原子的权重,并将其可视化为结构活动关系(sar)模式,显示训练模型所建议的正贡献子结构和负贡献子结构。
- visar提取化学物质的转化特征,构建活动景观,显示模型训练后的描述子空间与实验活动空间的相关性。
- 借助visar的交互式web应用,用户可以交互式地探索每种化学品的化学空间和sar模式。
- 然后,可以对景观上的化学物质集群进行有效药效团分析。
我们提出visar可以作为一个有用的工作流,用于深度神经网络qsar模型的训练和交互分析。
工作流程
(返回到目录)
培训、测试和结果处理流程可在Template Jupyter笔记本中找到:
完成训练过程后,在提示窗口中通过"bokeh serve--show visar_webapp"启动应用程序进行交互式探索。
交互式分析的一般步骤是:
设置预合成数据帧的位置(包括前缀)和训练模式。点击上方面板上的"运行"按钮后,整个界面将根据您的设置进行更新。
探索左侧面板上化学空间的活动概况。 有几个地方可以进行交互式探索,包括:a.用于散点图的颜色选项,根据化合物的不同活性启用不同的颜色呈现;b.与底部面板上热图的排列相关的双簇数量(通过尝试不同的双簇编号,用户可以了解活性曲线在化学景观中的分布);e.将鼠标悬停在散点图上时化合物的信息,显示其ID、批次ID和双簇所在位置的颜色代码当鼠标悬停在热图上时,显示批次的信息,显示其所属的双群集的ID和颜色代码。
选择左面板上的批次或单个化合物后,在右面板上可视化化学结构和合成孔径雷达模式。批量选择有两种方式:一是直接点击热图,二是使用下拉列表(C)。对于复合选择,使用散点图的点击模式并点击点。由于对于robustmt模式,多个任务给出了它们对应的合成孔径雷达模式;因此,通过选择合成孔径雷达任务(d),合成孔径雷达模式将相应地更新。
用于所选化合物和药效团分析的SDF文件的生成可参考模板Jupyter笔记本
使用说明
(返回到目录)
- 通过
将其作为zip存档文件下载并解压缩:
或者使用程序包将其克隆到您的计算机上
git clone https://github.com/Svvord/visar.git
- 对于训练环境,建议使用python=3.5,环境取决于:deepchem、rdkit、keras、tensorflow、numpy、pandas、sklearn、scipy。
# Install packages via pip
pip install visar
- 建议使用conda为可视化准备工作环境,请参阅teachopencadd。
# Create and activate an environment called `visar` conda create -n visar python=3.6 conda activate visar # Install packages via conda conda install bokeh conda install -c rdkit rdkit # Installs also numpy and pandas conda install -c conda-forge scikit-learn # Installs also scipy conda install jupyter # Installs also ipykernel conda install -c conda-forge seaborn # Installs also matplotlib conda install -c samoturk pymol # optional conda install -c conda-forge pmw # optional# start the web appcd /path/of/visar bokeh serve --show VISAR_webapp