Suppr超能文献

反应T5:一种用于在数据有限的情况下进行准确化学反应预测的预训练变压器模型。

ReactionT5: a pre-trained transformer model for accurate chemical reaction prediction with limited data.

作者信息

Sagawa Tatsuya, Kojima Ryosuke

机构信息

Graduate School of Pharmaceutical Sciences, Kyoto University, Kyoto, 606-8501, Japan.

RIKEN BDR, Kobe, 650-0047, Japan.

出版信息

J Cheminform. 2025 Aug 19;17(1):126. doi: 10.1186/s13321-025-01075-4.

Abstract

Accurate chemical reaction prediction is critical for reducing both cost and time in drug development. This study introduces ReactionT5, a transformer-based chemical reaction foundation model pre-trained on the Open Reaction Database-a large publicly available reaction dataset. In benchmarks for product prediction, retrosynthesis, and yield prediction, ReactionT5 outperformed existing models. Specifically, ReactionT5 achieved 97.5% accuracy in product prediction, 71.0% in retrosynthesis, and a coefficient of determination of 0.947 in yield prediction. Remarkably, ReactionT5, when fine-tuned with only a limited dataset of reactions, achieved performance on par with models fine-tuned on the complete dataset. Additionally, the visualization of ReactionT5 embeddings illustrates that the model successfully captures and represents the chemical reaction space, indicating effective learning of reaction properties.

摘要

准确的化学反应预测对于降低药物开发的成本和时间至关重要。本研究介绍了ReactionT5,这是一种基于Transformer的化学反应基础模型,在开放反应数据库(一个大型公开可用的反应数据集)上进行了预训练。在产品预测、逆合成和产率预测的基准测试中,ReactionT5的表现优于现有模型。具体而言,ReactionT5在产品预测中的准确率达到97.5%,在逆合成中达到71.0%,在产率预测中的决定系数为0.947。值得注意的是,ReactionT5仅使用有限的反应数据集进行微调时,其性能与在完整数据集上微调的模型相当。此外,ReactionT5嵌入的可视化表明该模型成功捕获并表示了化学反应空间,表明其有效地学习了反应特性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b294/12366004/6167e145cf47/13321_2025_1075_Fig4_HTML.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验