• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于机器学习方法的 SARS-CoV-2 3CLpro 抑制剂的 SAR 和 QSAR 研究。

A SAR and QSAR study on 3CLpro inhibitors of SARS-CoV-2 using machine learning methods.

机构信息

State Key Laboratory of Chemical Resource Engineering, Department of Pharmaceutical Engineering, Beijing University of Chemical Technology, Beijing, P. R. China.

出版信息

SAR QSAR Environ Res. 2024 Jul;35(7):531-563. doi: 10.1080/1062936X.2024.2375513. Epub 2024 Jul 30.

DOI:10.1080/1062936X.2024.2375513
PMID:39077983
Abstract

The 3C-like Proteinase (3CLpro) of novel coronaviruses is intricately linked to viral replication, making it a crucial target for antiviral agents. In this study, we employed two fingerprint descriptors (ECFP_4 and MACCS) to comprehensively characterize 889 compounds in our dataset. We constructed 24 classification models using machine learning algorithms, including Support Vector Machine (SVM), Random Forest (RF), extreme Gradient Boosting (XGBoost), and Deep Neural Networks (DNN). Among these models, the DNN- and ECFP_4-based Model 1D_2 achieved the most promising results, with a remarkable Matthews correlation coefficient (MCC) value of 0.796 in the 5-fold cross-validation and 0.722 on the test set. The application domains of the models were analysed using d calculations. The collected 889 compounds were clustered by K-means algorithm, and the relationships between structural fragments and inhibitory activities of the highly active compounds were analysed for the 10 obtained subsets. In addition, based on 464 3CLpro inhibitors, 27 QSAR models were constructed using three machine learning algorithms with a minimum root mean square error (RMSE) of 0.509 on the test set. The applicability domains of the models and the structure-activity relationships responded from the descriptors were also analysed.

摘要

新型冠状病毒的 3C 样蛋白酶(3CLpro)与病毒复制密切相关,是抗病毒药物的重要靶点。在本研究中,我们使用了两种指纹描述符(ECFP_4 和 MACCS)来全面描述我们数据集中的 889 种化合物。我们使用机器学习算法构建了 24 个分类模型,包括支持向量机(SVM)、随机森林(RF)、极端梯度提升(XGBoost)和深度神经网络(DNN)。在这些模型中,基于 DNN 和 ECFP_4 的模型 1D_2 取得了最有前景的结果,在 5 折交叉验证中的马修斯相关系数(MCC)值为 0.796,在测试集中为 0.722。使用 d 计算分析了模型的应用领域。使用 K-均值算法对 889 种化合物进行聚类,对 10 个获得的子集的高活性化合物的结构片段与抑制活性之间的关系进行了分析。此外,基于 464 种 3CLpro 抑制剂,使用三种机器学习算法构建了 27 个 QSAR 模型,在测试集上的最小均方根误差(RMSE)为 0.509。还分析了模型的适用域以及从描述符中得到的结构-活性关系。

相似文献

1
A SAR and QSAR study on 3CLpro inhibitors of SARS-CoV-2 using machine learning methods.基于机器学习方法的 SARS-CoV-2 3CLpro 抑制剂的 SAR 和 QSAR 研究。
SAR QSAR Environ Res. 2024 Jul;35(7):531-563. doi: 10.1080/1062936X.2024.2375513. Epub 2024 Jul 30.
2
Development of a simple, interpretable and easily transferable QSAR model for quick screening antiviral databases in search of novel 3C-like protease (3CLpro) enzyme inhibitors against SARS-CoV diseases.开发一个简单、可解释和易于转移的定量构效关系(QSAR)模型,用于快速筛选抗病毒数据库,以寻找针对 SARS-CoV 疾病的新型 3C 样蛋白酶(3CLpro)酶抑制剂。
SAR QSAR Environ Res. 2020 Jul;31(7):511-526. doi: 10.1080/1062936X.2020.1776388. Epub 2020 Jun 16.
3
3-chymotrypsin-like protease in SARS-CoV-2.SARS-CoV-2 中的 3-糜蛋白酶样蛋白酶。
Biosci Rep. 2024 Aug 28;44(8). doi: 10.1042/BSR20231395.
4
Machine learning-based QSAR and LB-PaCS-MD guided design of SARS-CoV-2 main protease inhibitors.基于机器学习的 SARS-CoV-2 主要蛋白酶抑制剂的定量构效关系和 LB-PaCS-MD 指导设计。
Bioorg Med Chem Lett. 2024 Sep 15;110:129852. doi: 10.1016/j.bmcl.2024.129852. Epub 2024 Jun 24.
5
Structure-activity relationship (SAR) and molecular dynamics study of withaferin-A fragment derivatives as potential therapeutic lead against main protease (M) of SARS-CoV-2.维甲酰萘醌 A 片段衍生物作为抗严重急性呼吸综合征冠状病毒 2 主蛋白酶 (M) 的潜在治疗先导物的构效关系 (SAR) 和分子动力学研究。
J Mol Model. 2021 Feb 28;27(3):97. doi: 10.1007/s00894-021-04703-6.
6
Structural stability of SARS-CoV-2 3CLpro and identification of quercetin as an inhibitor by experimental screening.SARS-CoV-2 3CLpro 的结构稳定性和通过实验筛选鉴定槲皮素为抑制剂。
Int J Biol Macromol. 2020 Dec 1;164:1693-1703. doi: 10.1016/j.ijbiomac.2020.07.235. Epub 2020 Aug 1.
7
Classification models and SAR analysis on thromboxane A synthase inhibitors by machine learning methods.基于机器学习方法的血栓素 A 合酶抑制剂的分类模型和 SAR 分析。
SAR QSAR Environ Res. 2022 Jun;33(6):429-462. doi: 10.1080/1062936X.2022.2078880. Epub 2022 Jun 9.
8
Development of a deep learning-based quantitative structure-activity relationship model to identify potential inhibitors against the 3C-like protease of SARS-CoV-2.基于深度学习的定量构效关系模型的开发,以鉴定针对 SARS-CoV-2 的 3C 样蛋白酶的潜在抑制剂。
Future Med Chem. 2022 Nov;14(21):1541-1559. doi: 10.4155/fmc-2021-0063. Epub 2022 Sep 30.
9
Antiviral evaluation of hydroxyethylamine analogs: Inhibitors of SARS-CoV-2 main protease (3CLpro), a virtual screening and simulation approach.羟乙胺类似物的抗病毒评估:针对 SARS-CoV-2 主蛋白酶(3CLpro)的抑制剂,一种虚拟筛选和模拟方法。
Bioorg Med Chem. 2021 Oct 1;47:116393. doi: 10.1016/j.bmc.2021.116393. Epub 2021 Sep 4.
10
Drugs Repurposing Using QSAR, Docking and Molecular Dynamics for Possible Inhibitors of the SARS-CoV-2 M Protease.利用定量构效关系、对接和分子动力学对严重急性呼吸综合征冠状病毒2 M蛋白酶的潜在抑制剂进行药物再利用研究
Molecules. 2020 Nov 6;25(21):5172. doi: 10.3390/molecules25215172.