Inno-ADMET

1.  Inno-ADMET 概述

ADMET 模块主要用于系统的评价药物的吸收、分布、代谢、排泄和毒性性质,也包括一些理化性质和药物化学性质。众多研究表明早期的 ADMET 性质评价可显著地提高药物研发的成功率。针对不同的需求,系统提供了两个不同的模型来计算成药性性质,分别为基于预训练的 MERT 模型和基于 GNN 子结构可解释性的 MGA 模型。基于自主收集的高质量数据,这两个模型均可实现 17 种物化性质、5 种药物化学性质、6 种类药性规则、21 种 ADME 性质、27 种毒性性质的系统性评价。从模型评估指标的角度来说,MERT 模型更为优秀,根据模型能否提供子结构对预测结果的影响上判断,MGA 模型更具优势,用户可根据自己的需要去选择相应的计算模型。

2.   使用说明

用户只需要四个步骤就可以完成计算:选择方法(默认选择 MERT)-确定输入方式(输入 smiles)-任务命名(可忽略)-提交任务(必点)。

(1) 选择方法

- MERT(Pre-train):为基于预训练的模型,模型的精度更高,预测能力更好,且速度快,计算一个分子只需 2.35ms;

图 1. 创建 Inno-ADMET 任务页面——MERT 模型

- MGA (Interpretability):基于 GNN 子结构可解释性的 MGA 模型,模型预测效果不如 MERT(Pre-train),但该方法能够有效的计算子结构对预测结果的贡献度,有助于挖掘构效关系,在一定程度上可以指导结构优化。选择 MGA 进行计算时,有一个子结构可解释性的开关,由用户决定是否计算子结构可解释性。如打开该开关,系统将会计算子结构对属性的影响,但同时也会增加计算时间,不如 MERT 方法。

图 2. 创建 Inno-ADMET 任务页面——MGA 模型

(2) 输入方式

平台提供了四种数据输入方式:输入 SMILES、绘制分子、上传文件和数据中心。

- 输入 SMILES

复选框选中“输入 SMILES”,在文本框中输入一个或多个 SMILES 表达式(用换行的方式输入多个 SMILES),该文本框中最多可输入 500 个 SMILES(超出上限可通过上传文件的形式提交任务)。

图 3. 输入方式——输入 SMILES

- 绘制分子

复选框选中“绘制分子”,在右边的分子编辑器中画出分子结构,画好以后点击右下角的“确认”后即可。该模式下只支持画一个分子。

图 4. 输入方式——绘制分子

- 上传文件

复选框选中“上传文件”,通过点击下方按钮选择本地文件即可。选择完文件以后,该文件名称将显示在按钮上,右边将显示文件内容。 关于上传的文件:

  • 当前支持的文件格式: .sdf/.csv;如上传 sdf 文件,则可直接提交任务,如上传 csv 文件,则需指定 smiles 列后方能提交任务。

  • 文件大小不超过 10MB。

- 数据中心

复选框选中“数据中心”,通过点击下方按钮页面出现弹窗,点击文件名称来选择数据中心的数据,点击完之后弹窗消失,即可提交任务。

图 5. 输入方式——上传文件/数据中心

(3) 运行进度和结果查看

提交任务后,页面会自动跳入当前页面的“最近结果”子页面中,你可以在该页面查看当前模块的任务运行状态(进度条),也可在右上角的“运行中“下拉框中查看所有模块正在运行的任务。当数据量较大时,系统会分批计算,因此只要有一批数据算完后(整个任务还在运行中),即可点击“结果详情”按钮进入结果页面,查看当前已完成计算的预测结果列表(未完成计算的分子暂不显示),并且可以在当前页面通过刷新来获取最新算完的数据。

图 6. 查看结果

3. 结果分析

结果页面由顶部的 Summary、左侧的筛选区和中部的结果详情区组成。默认状态下结果详情区展示的是结果列表(还可以切换卡片和图表子页面),此时你可以查看预测的所有性质,并对这些性质进行排序、筛选;同时为了方便用户直观的分析数据,我们给预测结果分配了一个颜色。

图 7. 结果页面功能分布

(1) 颜色定义

由于不同的性质有不同的建议取值区间,因此我们通过颜色对预测结果做了直观的评估。颜色设置的规则如下:

- 针对预测结果为 0-1 之间的性质:

  • P≤0.5,数值的底色为绿色,代表预测的化合物不属于该类别的化合物;

  • 05<P<0.7,数值的底色为黄色,代表预测化合物有可能属于该类化合物;

  • P≥0.7,数值的底色为红色,代表预测的化合物很有可能属于该类化合物。

- 针对有最优区间的性质,如:

  • Fsp3 的最优取值为 Fsp3≥0.42,定义两个颜色,符合该阈值的为绿色,不符合的为红色;

  • Log S 的最优区间为-4~0.5,定义两个颜色,在区间内的为绿色,超出区间的为红色;

  • QED 的取值有三种定义:Attractive: > 0.67; unattractive: 0.49-0.67; too complex: < 0.34,按照该定义分配红绿黄的颜色即可。

通过以上颜色区分,你可以更直观的了解了解分子的整体评价结果。绿色背景越多,说明分子的 ADMET 性质越好,反之亦然。

(2) 筛选

平台提供了常规筛选和高级筛选以满足用户的使用需求。

- 常规筛选

常规筛选可以显示/隐藏性质。默认的结果列表展示计算的所有性质,此时左边控制栏中为全选的状态。当你不想显示该性质时,取消该性质的选中即可,左边的结果列表将根据控制栏中的选择进行实时显示。在顶部还提供了两个快捷键“全选”和“不选”,方便用户快速选择。

- 高级筛选

在常规筛选的基础上,高级筛选提供了范围筛选,可进一步筛选出某性质指定范围内的分子,以排除不符合预期结果的分子。

(3) 属性解释

把鼠标移入每个性质的名称上,可查看该属性对应的解释。

(4) 排序

点击结果列表中的性质名字可重新排序,如 F(20%),点击一次为升序,再点一次为降序,再点一次即恢复原始排序。

(5) 单个分子详情页

当你想查看某一个分子的所有性质时,可以在结果列表通过点击该分子结构进入分子详情页。

图 8. 分子详情页面-MERT 模型

图 9. 分子详情页面-MGA 模型(计算了子结构可解释性)

(6) 保存

点击“保存”,系统将弹出下拉框让你选择保存的文件格式(目前仅支持.csv/.sdf)。确定好下载的文件样式后,系统将根据你的显示隐藏列的条件和高级筛选的条件,保存相应的数据为 sdf 或 csv 文件至数据中心。

(7)下载

点击“下载”,系统将弹出下拉框让你选择下载的文件格式(目前仅支持.csv/.sdf)。确定好下载的文件样式后,系统将根据你的显示隐藏列的条件和高级筛选的条件,保存相应的数据为 sdf 或 csv 文件至你的本地设备上。

(8) 创建新任务

创建新任务的前提是先保存数据为一个文件,在未执行保存操作之前,该按钮为禁用状态,当机遇结果保存了新的文件后,该按钮为可用状态。此时点击该按钮,系统将弹出下拉框让你选择需要计算的工,点击后页面将立即开一个新的标签页,并将你保存的数据集一并带过去,在调整参数后即可提交新的任务。

(9) 隐藏无效分子

针对 SMILES 错误或者后台无法解析的分子,算法无法进行正确的计算,在这种情况下,任务不受影响,但分子被定义为无效分子。用户可以通过“隐藏无效分子”的按钮,快速过滤掉该部分的分子。

(10)卡片页面

在卡片页面,我们提供了一个更加简洁的方式查看结果,你只能看到该分子的结构及 3 个基础的性质:MW、SA 和 QED。

图 10. 结果的网格页面

4. 相关算法介绍

系统提供了两个不同的模型来计算成药性性质,分别为基于预训练的 MERT 模型和基于 GNN 子结构可解释性的 MGA 模型。Inno-ADMET(MERT)和 Inno-ADMET(MGA)建模框架如图 1 和 2 所示。

图 11. Inno-ADMET(MERT)建模框架

图 12. Inno-ADMET(MGA)建模框架

除了我们的 ADMET 模块,同类型计算 ADMET 性质的平台还有 Swiss-ADME、admetSAR 2.0、FAF-Drugs4、pkCSM 和 vNN-ADMET,我们详细比较了这些平台之间的差异,其详细信息汇总在表 1 中。经详细比较得知,这些平台工具各有侧重点,比如 Swiss-ADME 可以提供 logP 和 logS 的多种计算方法以及各种药物相似性规则;admetSAR 2.0 包括最多样化的代谢特性;FAF-Drugs4 首次尝试在 ADMET 评估中加入毒物规则;而 vNN-ADME 中可用的预测性质相对有限。相比之下,ADMET 模块可用于预测分子质量的每个重要方面,涵盖药物化学家感兴趣的主要终点。尤其是平台提供的一些毒性子结构规则、毒性途径和一些药物化学性质预测是独一无二的工具。MERT 模型和 MGA 模型预测结果如表 2 所示。从模型评估指标上来看,Inno-ADMET (MERT) 比其他平台准确率更高;从结果可解释性的角度来看,Inno-ADMET (MGA) 更具优势。 另外从速度上来说,Inno-ADMET (MERT)的速度要优于 Inno-ADMET (MGA),Inno-ADMET (MERT)的速度达到了 2.35ms/分子。

表 1. ADMET 模块与其他基于 web 的工具的主要特性比较。“+”表示支持该特性,每多增加一个“+”表示支持度更高。

表 2. 各个平台的平均评估结果

5. 相关文献

[1] Chemistry-intuitive explanation of graph neural networks for molecular property prediction with substructure masking. Wu Z, Wang J, Du H, et al. Nat Commun. 2023;14(1):2585. doi:10.1038/s41467-023-38192-3

[2] ADMETlab 2.0: an integrated online platform for accurate and comprehensive predictions of ADMET properties. Xiong G, Wu Z, Yi J, et al. Nucleic Acids Res. 2021;49(W1):W5-W14. doi:10.1093/nar/gkab255

[3] ADMETlab: a platform for systematic ADMET evaluation based on a comprehensively collected ADMET database. Dong J, Wang NN, Yao ZJ, et al.  J Cheminform. 2018;10(1):29. Published 2018 Jun 26. doi:10.1186/s13321-018-0283-x

Edit this page open in new window
最后更新: 2024/8/23 14:49:47