• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

化学反应定量构效关系建模中的交叉验证策略。

Cross-validation strategies in QSPR modelling of chemical reactions.

机构信息

A.M. Butlerov Institute of Chemistry, Kazan Federal University, Kazan, Russia.

Laboratory of Chemoinformatics, UMR 7140 CNRS, University of Strasbourg, Strasbourg, France.

出版信息

SAR QSAR Environ Res. 2021 Mar;32(3):207-219. doi: 10.1080/1062936X.2021.1883107. Epub 2021 Feb 19.

DOI:10.1080/1062936X.2021.1883107
PMID:33601989
Abstract

In this article, we consider cross-validation of the quantitative structure-property relationship models for reactions and show that the conventional k-fold cross-validation (CV) procedure gives an 'optimistically' biased assessment of prediction performance. To address this issue, we suggest two strategies of model cross-validation, 'transformation-out' CV, and 'solvent-out' CV. Unlike the conventional k-fold cross-validation approach that does not consider the nature of objects, the proposed procedures provide an unbiased estimation of the predictive performance of the models for novel types of structural transformations in chemical reactions and reactions going under new conditions. Both the suggested strategies have been applied to predict the rate constants of bimolecular elimination and nucleophilic substitution reactions, and Diels-Alder cycloaddition. All suggested cross-validation methodologies and tutorial are implemented in the open-source software package CIMtools (https://github.com/cimm-kzn/CIMtools).

摘要

在本文中,我们考虑了反应的定量构效关系模型的交叉验证,并表明传统的 k 折交叉验证(CV)程序对预测性能的评估存在“乐观”偏差。为了解决这个问题,我们提出了两种模型交叉验证策略,即“变换外”CV 和“溶剂外”CV。与不考虑对象性质的传统 k 折交叉验证方法不同,所提出的程序为化学反应中的新型结构转化和新条件下的反应的模型的预测性能提供了无偏估计。这两种策略都被应用于预测双分子消除和亲核取代反应以及 Diels-Alder 环加成的速率常数。所有建议的交叉验证方法和教程都在开源软件包 CIMtools(https://github.com/cimm-kzn/CIMtools)中实现。

相似文献

1
Cross-validation strategies in QSPR modelling of chemical reactions.化学反应定量构效关系建模中的交叉验证策略。
SAR QSAR Environ Res. 2021 Mar;32(3):207-219. doi: 10.1080/1062936X.2021.1883107. Epub 2021 Feb 19.
2
Bimolecular Nucleophilic Substitution Reactions: Predictive Models for Rate Constants and Molecular Reaction Pairs Analysis.双分子亲核取代反应:速率常数的预测模型与分子反应对分析。
Mol Inform. 2019 Apr;38(4):e1800104. doi: 10.1002/minf.201800104. Epub 2018 Nov 23.
3
Development of a robust and validated 2D-QSPR model for sweetness potency of diverse functional organic molecules.开发一种稳健且经过验证的二维定量构效关系模型,用于预测多种功能有机分子的甜度效力。
Food Chem Toxicol. 2018 Feb;112:551-562. doi: 10.1016/j.fct.2017.03.043. Epub 2017 Mar 24.
4
Structure-reactivity modeling using mixture-based representation of chemical reactions.使用基于混合物的化学反应表示法进行结构-反应性建模。
J Comput Aided Mol Des. 2017 Sep;31(9):829-839. doi: 10.1007/s10822-017-0044-3. Epub 2017 Jul 27.
5
Exploring the QSAR's predictive truthfulness of the novel N-tuple discrete derivative indices on benchmark datasets.探索新型N元组离散导数指标在基准数据集上的定量构效关系(QSAR)预测真实性。
SAR QSAR Environ Res. 2017 May;28(5):367-389. doi: 10.1080/1062936X.2017.1326403.
6
A Monte Carlo method based QSPR model for prediction of reaction rate constants of hydrated electrons with organic contaminants.基于蒙特卡罗方法的 QSPR 模型预测水合电子与有机污染物的反应速率常数。
SAR QSAR Environ Res. 2020 Dec;31(12):935-950. doi: 10.1080/1062936X.2020.1842495. Epub 2020 Nov 12.
7
Predictive Models for Kinetic Parameters of Cycloaddition Reactions.预测环加成反应动力学参数的模型。
Mol Inform. 2019 Jan;38(1-2):e1800077. doi: 10.1002/minf.201800077. Epub 2018 Aug 22.
8
QSPR modelling of dielectric constants of π-conjugated organic compounds by means of the CORAL software.利用CORAL软件对π共轭有机化合物的介电常数进行定量结构-性质关系建模。
SAR QSAR Environ Res. 2014;25(6):507-26. doi: 10.1080/1062936X.2014.899267. Epub 2014 Apr 9.
9
Heterogeneous fenton degradation of azo dyes catalyzed by modified polyacrylonitrile fiber fe complexes: QSPR (quantitative structure peorperty relationship) study.改性聚丙烯腈纤维 fe 配合物催化偶氮染料的非均相芬顿降解:定量结构性质关系研究。
J Environ Sci (China). 2013 Jul 1;25(7):1469-76. doi: 10.1016/s1001-0742(12)60190-9.
10
Comparative studies on some metrics for external validation of QSPR models.比较研究 QSPR 模型外部验证的一些指标。
J Chem Inf Model. 2012 Feb 27;52(2):396-408. doi: 10.1021/ci200520g. Epub 2012 Jan 17.

引用本文的文献

1
Genetic algorithm multiple linear regression and machine learning-driven QSTR modeling for the acute toxicity of sterol biosynthesis inhibitor fungicides.基于遗传算法多元线性回归和机器学习的甾醇生物合成抑制剂类杀菌剂急性毒性定量构效关系建模
Heliyon. 2024 Aug 15;10(16):e36373. doi: 10.1016/j.heliyon.2024.e36373. eCollection 2024 Aug 30.
2
The System of Self-Consistent Models: The Case of Henry's Law Constants.自洽模型系统:亨利定律常数的情况
Molecules. 2023 Oct 23;28(20):7231. doi: 10.3390/molecules28207231.
3
High-throughput synthesis provides data for predicting molecular properties and reaction success.
高通量合成提供了预测分子性质和反应成功的数据。
Sci Adv. 2023 Oct 27;9(43):eadj2314. doi: 10.1126/sciadv.adj2314.
4
Characterizing Uncertainty in Machine Learning for Chemistry.机器学习在化学中的不确定性描述。
J Chem Inf Model. 2023 Jul 10;63(13):4012-4029. doi: 10.1021/acs.jcim.3c00373. Epub 2023 Jun 20.
5
Reaction performance prediction with an extrapolative and interpretable graph model based on chemical knowledge.基于化学知识的外推和可解释图模型的反应性能预测。
Nat Commun. 2023 Jun 15;14(1):3569. doi: 10.1038/s41467-023-39283-x.
6
Predictive chemistry: machine learning for reaction deployment, reaction development, and reaction discovery.预测化学:用于反应部署、反应开发和反应发现的机器学习
Chem Sci. 2022 Nov 28;14(2):226-244. doi: 10.1039/d2sc05089g. eCollection 2023 Jan 4.