• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

RxnScribe:一种用于反应图解析的序列生成模型。

RxnScribe: A Sequence Generation Model for Reaction Diagram Parsing.

机构信息

Computer Science and Artificial Intelligence Laboratory, Massachusetts Institute of Technology, Cambridge, Massachusetts 02139, United States.

Department of Chemical Engineering, Massachusetts Institute of Technology, Cambridge, Massachusetts 02139, United States.

出版信息

J Chem Inf Model. 2023 Jul 10;63(13):4030-4041. doi: 10.1021/acs.jcim.3c00439. Epub 2023 Jun 27.

DOI:10.1021/acs.jcim.3c00439
PMID:37368970
Abstract

Reaction diagram parsing is the task of extracting reaction schemes from a diagram in the chemistry literature. The reaction diagrams can be arbitrarily complex; thus, robustly parsing them into structured data is an open challenge. In this paper, we present RxnScribe, a machine learning model for parsing reaction diagrams of varying styles. We formulate this structured prediction task with a sequence generation approach, which condenses the traditional pipeline into an end-to-end model. We train RxnScribe on a dataset of 1378 diagrams and evaluate it with cross validation, achieving an 80.0% soft match F1 score, with significant improvements over previous models. Our code and data are publicly available at https://github.com/thomas0809/RxnScribe.

摘要

反应图解析是从化学文献中的图表中提取反应方案的任务。反应图可以是任意复杂的;因此,将它们稳健地解析为结构化数据是一个开放的挑战。在本文中,我们提出了 RxnScribe,这是一种用于解析不同风格的反应图的机器学习模型。我们使用序列生成方法来制定这个结构化预测任务,将传统的流水线压缩为一个端到端的模型。我们在一个包含 1378 个图表的数据集上训练 RxnScribe,并通过交叉验证进行评估,得到了 80.0%的软匹配 F1 分数,明显优于以前的模型。我们的代码和数据可在 https://github.com/thomas0809/RxnScribe 上获得。

相似文献

1
RxnScribe: A Sequence Generation Model for Reaction Diagram Parsing.RxnScribe:一种用于反应图解析的序列生成模型。
J Chem Inf Model. 2023 Jul 10;63(13):4030-4041. doi: 10.1021/acs.jcim.3c00439. Epub 2023 Jun 27.
2
OpenChemIE: An Information Extraction Toolkit for Chemistry Literature.OpenChemIE:一个化学文献信息抽取工具包。
J Chem Inf Model. 2024 Jul 22;64(14):5521-5534. doi: 10.1021/acs.jcim.4c00572. Epub 2024 Jul 1.
3
MolScribe: Robust Molecular Structure Recognition with Image-to-Graph Generation.MolScribe:通过图像到图形生成实现强大的分子结构识别。
J Chem Inf Model. 2023 Apr 10;63(7):1925-1934. doi: 10.1021/acs.jcim.2c01480. Epub 2023 Mar 27.
4
An end-to-end deep learning architecture for extracting protein-protein interactions affected by genetic mutations.一种用于提取受基因突变影响的蛋白质-蛋白质相互作用的端到端深度学习架构。
Database (Oxford). 2018 Jan 1;2018:1-13. doi: 10.1093/database/bay092.
5
End-to-end face parsing via interlinked convolutional neural networks.通过互连卷积神经网络实现端到端面部解析
Cogn Neurodyn. 2021 Feb;15(1):169-179. doi: 10.1007/s11571-020-09615-4. Epub 2020 Jul 13.
6
Image Comes Dancing With Collaborative Parsing-Flow Video Synthesis.图像与协作解析流视频合成共舞。
IEEE Trans Image Process. 2021;30:9259-9269. doi: 10.1109/TIP.2021.3123549. Epub 2021 Nov 12.
7
Benchmarking of Machine Learning classifiers on plasma proteomic for COVID-19 severity prediction through interpretable artificial intelligence.基于机器学习的分类器在 COVID-19 严重程度预测血浆蛋白质组学中的基准测试:通过可解释的人工智能。
Artif Intell Med. 2023 Mar;137:102490. doi: 10.1016/j.artmed.2023.102490. Epub 2023 Jan 18.
8
Alignment Relation is What You Need for Diagram Parsing.对齐关系是图表解析所需的要素。
IEEE Trans Image Process. 2024;33:2131-2144. doi: 10.1109/TIP.2024.3374511. Epub 2024 Mar 18.
9
A machine learning approach to estimation of phase diagrams for three-component lipid mixtures.一种机器学习方法用于估算三组分脂质混合物的相图。
Biochim Biophys Acta Biomembr. 2020 Sep 1;1862(9):183350. doi: 10.1016/j.bbamem.2020.183350. Epub 2020 May 11.
10
Weakly Supervised Learning for Textbook Question Answering.用于教科书问答的弱监督学习
IEEE Trans Image Process. 2022;31:7378-7388. doi: 10.1109/TIP.2022.3180563. Epub 2022 Dec 1.

引用本文的文献

1
Automated electrosynthesis reaction mining with multimodal large language models (MLLMs).使用多模态大语言模型(MLLMs)进行自动化电合成反应挖掘。
Chem Sci. 2024 Oct 9;15(43):17881-91. doi: 10.1039/d4sc04630g.
2
Machine learning-guided strategies for reaction conditions design and optimization.用于反应条件设计与优化的机器学习引导策略。
Beilstein J Org Chem. 2024 Oct 4;20:2476-2492. doi: 10.3762/bjoc.20.212. eCollection 2024.
3
EnzChemRED, a rich enzyme chemistry relation extraction dataset.EnzChemRED,一个富含酶化学关系提取的数据集。
Sci Data. 2024 Sep 9;11(1):982. doi: 10.1038/s41597-024-03835-7.
4
Fine-tuning large language models for chemical text mining.针对化学文本挖掘对大语言模型进行微调。
Chem Sci. 2024 Jun 7;15(27):10600-10611. doi: 10.1039/d4sc00924j. eCollection 2024 Jul 10.
5
When Yield Prediction Does Not Yield Prediction: An Overview of the Current Challenges.当产量预测无法预测时:当前挑战概述。
J Chem Inf Model. 2024 Jan 8;64(1):42-56. doi: 10.1021/acs.jcim.3c01524. Epub 2023 Dec 20.
6
ReactionDataExtractor 2.0: A Deep Learning Approach for Data Extraction from Chemical Reaction Schemes.反应数据提取器 2.0:一种从化学反应图中提取数据的深度学习方法。
J Chem Inf Model. 2023 Oct 9;63(19):6053-6067. doi: 10.1021/acs.jcim.3c00422. Epub 2023 Sep 20.