基于机器学习与分子动力学模拟发现CDK2抑制剂.pdf

基于机器学习与分子动力学模拟发现CDK2抑制剂.pdf

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

基于机器学习与分子动力学模拟发现CDK2抑制剂

摘要

细胞周期异常是细胞病变的标志之一。其中,增殖失调是由于细胞以机械

方式进行有丝分裂,从而导致细胞周期异常。因此,针对细胞周期的癌症治疗

方案是非常有吸引力的。细胞周期蛋白依赖性激酶(CDK)是控制细胞周期转

换和分裂的关键调控酶,所以,CDK一直被认为是潜在的癌症治疗靶点。新的

证据表明,抑制CDK2活性具有治疗某些肿瘤疾病(例如神经母细胞瘤和结肠

癌等)的可行性。细胞周期蛋白依赖性激酶2(CDK2)驱动细胞进入细胞周期

的S期(DNA合成期)和M期(有丝分裂期)。虽然CDK2在肿瘤机制中的作

用存在争议,随着越来越多关于CDK2对癌症具有影响的报道被证实,开发

CDK2的活性抑制剂成为抗癌研究的主要方向之一。目前,并没有主要针对

CDK2的药物,所以开发CDK2的抑制剂是必要的。

因此,本研究的目的是探索CDK2的抑制剂,发现CDK2潜在的抑制剂。

首先,利用现有的大型活性数据库和机器学习算法,建立了针对CDK2抑制剂

的分类模型。通过指标分析(AUC、ACC、SE、SP等),发现基于圆形指纹

(ECFP6)的极端梯度提升树模型(XGBoost)、随机森林(RF)模型以及图神

经网络指纹算法(AttentiveFP)在CDK2数据集中表现出良好的预测性能。其

次,为了解释模型预测结果的可靠性,使用了ShapleyAdditiveExplanations

(SHAP)算法对模型进行解释,通过对模型的解释确定了CDK2数据集中一些

活性指纹片段,例如1476、1292和1582位指纹片段,这些片段可以为先导化

合物的优化和改造提供指导意见。通过比较不同模型的预测效果和泛化性能,

我们选择了XGBoost模型筛选未知活性的数据库,它具有在预测活性与非活性

化合物就有良好的稳定性。我们通过机器学习模型在未知数据库中筛选出了

1152个新型化合物,并通过分子对接和打分函数对这些潜在化合物在CDK2中

的亲和力进行了排序。我们发现所有被筛选出的化合物在CDK2配体中的对接

评分都在-7.0kcal/mol以下。为了避免通过对接评分筛选的化合物结构的单一,

因此采用指纹聚类的方法对化合物分为四类,分别从四类中选择一种对接评分

I

摘要

较高的化合物。然后将四种化合物进行了类药性分析和分子动力学模拟,以验

证它们在成药方面的可行性和在受体中的相互作用以及结合自由能。筛选出的

四种潜在的CDK2抑制剂(Z1766368563、Z363564868、Z1891240670和

Z2701273053)经过类药性分析后具有良好的成药性,并在分子动力学模拟结

果中具有较高的结合自由能。表明四种化合物能够稳定存在CDK2并作为先导

化合物进行后续的改造和优化。

关键词:

CDK2抑制剂,机器学习,SHAP解释性,分子动力学,结合自由能

II

Abstract

DiscoveryofCDK2inhibitorsbasedonmachinelearningand

moleculardy

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档