• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使化学的集体知识开放并可用于机器操作。

Making the collective knowledge of chemistry open and machine actionable.

机构信息

Laboratory of Molecular Simulation (LSMO), Institut des Sciences et Ingenierie Chimiques (ISIC), École Polytechnique Fédérale de Lausanne (EPFL), Sion, Switzerland.

Institut des Sciences et Ingénierie Chimiques (ISIC), École Polytechnique Fédérale de Lausanne (EPFL), Lausanne, Switzerland.

出版信息

Nat Chem. 2022 Apr;14(4):365-376. doi: 10.1038/s41557-022-00910-7. Epub 2022 Apr 4.

DOI:10.1038/s41557-022-00910-7
PMID:35379967
Abstract

Large amounts of data are generated in chemistry labs-nearly all instruments record data in a digital form, yet a considerable proportion is also captured non-digitally and reported in ways non-accessible to both humans and their computational agents. Chemical research is still largely centred around paper-based lab notebooks, and the publication of data is often more an afterthought than an integral part of the process. Here we argue that a modular open-science platform for chemistry would be beneficial not only for data-mining studies but also, well beyond that, for the entire chemistry community. Much progress has been made over the past few years in developing technologies such as electronic lab notebooks that aim to address data-management concerns. This will help make chemical data reusable, however it is only one step. We highlight the importance of centring open-science initiatives around open, machine-actionable data and emphasize that most of the required technologies already exist-we only need to connect, polish and embrace them.

摘要

大量的数据在化学实验室中产生——几乎所有的仪器都以数字形式记录数据,但相当一部分数据也是以非数字形式捕获的,并且以人类和他们的计算代理都无法访问的方式报告。化学研究仍然主要集中在基于纸张的实验室笔记本上,数据的发布通常更多是事后的想法,而不是过程的一个组成部分。在这里,我们认为,一个模块化的化学开放科学平台不仅对数据挖掘研究有益,而且对整个化学界也有益。在过去几年中,开发电子实验室笔记本等旨在解决数据管理问题的技术方面已经取得了很大进展。这将有助于使化学数据可重复使用,然而这只是其中的一步。我们强调围绕开放、可机器操作的数据开展开放科学计划的重要性,并强调大多数所需的技术已经存在——我们只需要连接、完善和采用它们。

相似文献

1
Making the collective knowledge of chemistry open and machine actionable.使化学的集体知识开放并可用于机器操作。
Nat Chem. 2022 Apr;14(4):365-376. doi: 10.1038/s41557-022-00910-7. Epub 2022 Apr 4.
2
Machines first, humans second: on the importance of algorithmic interpretation of open chemistry data.机器优先,人类其次:论算法解释开放化学数据的重要性。
J Cheminform. 2015 Mar 22;7:9. doi: 10.1186/s13321-015-0057-7. eCollection 2015.
3
eLabFTW as an Open Science tool to improve the quality and translation of preclinical research.eLabFTW 作为一种开放科学工具,可提高临床前研究的质量和转化。
F1000Res. 2021 Apr 16;10:292. doi: 10.12688/f1000research.52157.3. eCollection 2021.
4
Macromolecular crowding: chemistry and physics meet biology (Ascona, Switzerland, 10-14 June 2012).大分子拥挤现象:化学与物理邂逅生物学(瑞士阿斯科纳,2012年6月10日至14日)
Phys Biol. 2013 Aug;10(4):040301. doi: 10.1088/1478-3975/10/4/040301. Epub 2013 Aug 2.
5
The future of Cochrane Neonatal.考克兰新生儿协作网的未来。
Early Hum Dev. 2020 Nov;150:105191. doi: 10.1016/j.earlhumdev.2020.105191. Epub 2020 Sep 12.
6
Ten principles for machine-actionable data management plans.可机处理数据管理计划的 10 项原则。
PLoS Comput Biol. 2019 Mar 28;15(3):e1006750. doi: 10.1371/journal.pcbi.1006750. eCollection 2019 Mar.
7
A simple kit to use computational notebooks for more openness, reproducibility, and productivity in research.一个简单的工具包,用于在研究中提高开放性、可重复性和生产力的计算笔记本。
PLoS Comput Biol. 2022 Sep 15;18(9):e1010356. doi: 10.1371/journal.pcbi.1010356. eCollection 2022 Sep.
8
Minimum Information Standards in Chemistry: A Call for Better Research Data Management Practices.化学最小信息标准:呼吁更好的研究数据管理实践。
Angew Chem Int Ed Engl. 2022 Dec 19;61(51):e202203038. doi: 10.1002/anie.202203038. Epub 2022 Nov 8.
9
10
Proceedings of the Second Workshop on Theory meets Industry (Erwin-Schrödinger-Institute (ESI), Vienna, Austria, 12-14 June 2007).第二届理论与产业研讨会会议录(2007年6月12日至14日,奥地利维也纳埃尔温·薛定谔研究所)
J Phys Condens Matter. 2008 Feb 13;20(6):060301. doi: 10.1088/0953-8984/20/06/060301. Epub 2008 Jan 24.

引用本文的文献

1
Negative chemical data boosts language models in reaction outcome prediction.负面化学数据在反应结果预测中提升语言模型。
Sci Adv. 2025 Jun 13;11(24):eadt5578. doi: 10.1126/sciadv.adt5578.
2
Carbohydrate Synthesis is Entering the Data-Driven Digital Era.碳水化合物合成正步入数据驱动的数字时代。
Chemistry. 2025 May 14;31(27):e202500289. doi: 10.1002/chem.202500289. Epub 2025 Apr 18.
3
Discovering organic reactions with a machine-learning-powered deciphering of tera-scale mass spectrometry data.通过机器学习驱动的太赫兹级质谱数据解析发现有机反应。

本文引用的文献

1
A Universal Standard Archive File for Adsorption Data.通用吸附数据档案文件
Langmuir. 2021 Apr 13;37(14):4222-4226. doi: 10.1021/acs.langmuir.1c00122. Epub 2021 Apr 2.
2
A universal system for digitization and automatic execution of the chemical synthesis literature.一种用于化学合成文献数字化和自动执行的通用系统。
Science. 2020 Oct 2;370(6512):101-108. doi: 10.1126/science.abc2986.
3
Crowdsourcing drug discovery for pandemics.众包应对大流行病的药物研发。
Nat Commun. 2025 Mar 16;16(1):2587. doi: 10.1038/s41467-025-56905-8.
4
A Holistic Data-Driven Approach to Synthesis Predictions of Colloidal Nanocrystal Shapes.一种基于数据驱动的整体方法用于胶体纳米晶体形状的合成预测
J Am Chem Soc. 2025 Feb 19;147(7):6116-6125. doi: 10.1021/jacs.4c17283. Epub 2025 Feb 7.
5
Simple User-Friendly Reaction Format.简单易用的反应格式。
Mol Inform. 2025 Jan;44(1):e202400361. doi: 10.1002/minf.202400361.
6
What I Learned from Analyzing Accurate Mass Data of 3000 Supporting Information Files.我从分析3000个补充信息文件的精确质量数据中学到的东西。
Org Lett. 2025 Jan 10;27(1):4-7. doi: 10.1021/acs.orglett.4c03458. Epub 2024 Dec 19.
7
Assessment of fine-tuned large language models for real-world chemistry and material science applications.用于实际化学和材料科学应用的微调大语言模型评估。
Chem Sci. 2024 Nov 22;16(2):670-684. doi: 10.1039/d4sc04401k. eCollection 2025 Jan 2.
8
Catalysing (organo-)catalysis: Trends in the application of machine learning to enantioselective organocatalysis.催化(有机)催化:机器学习在对映选择性有机催化中的应用趋势
Beilstein J Org Chem. 2024 Sep 10;20:2280-2304. doi: 10.3762/bjoc.20.196. eCollection 2024.
9
Recent advances in artificial intelligent strategies for tissue engineering and regenerative medicine.人工智能策略在组织工程和再生医学中的最新进展。
Skin Res Technol. 2024 Sep;30(9):e70016. doi: 10.1111/srt.70016.
10
Advancing materials science through next-generation machine learning.通过下一代机器学习推动材料科学发展。
Curr Opin Solid State Mater Sci. 2024 Jun;30. doi: 10.1016/j.cossms.2024.101157. Epub 2024 Apr 3.
Nat Chem. 2020 Jul;12(7):581. doi: 10.1038/s41557-020-0496-2.
4
Big-Data Science in Porous Materials: Materials Genomics and Machine Learning.多孔材料中的大数据科学:材料基因组学与机器学习。
Chem Rev. 2020 Aug 26;120(16):8066-8129. doi: 10.1021/acs.chemrev.0c00004. Epub 2020 Jun 10.
5
The rise of preprints in chemistry.
Nat Chem. 2020 Jun;12(6):499-502. doi: 10.1038/s41557-020-0477-5.
6
Ontology mapping for semantically enabled applications.本体映射在语义支持的应用程序中。
Drug Discov Today. 2019 Oct;24(10):2068-2075. doi: 10.1016/j.drudis.2019.05.020. Epub 2019 May 31.
7
Capturing chemical intuition in synthesis of metal-organic frameworks.捕捉金属-有机骨架合成中的化学直觉。
Nat Commun. 2019 Feb 1;10(1):539. doi: 10.1038/s41467-019-08483-9.
8
How to pick an electronic laboratory notebook.如何挑选电子实验室笔记本。
Nature. 2018 Aug;560(7717):269-270. doi: 10.1038/d41586-018-05895-3.
9
The value of universally available raw NMR data for transparency, reproducibility, and integrity in natural product research.普遍获得的原始 NMR 数据在天然产物研究中的透明度、可重复性和完整性的价值。
Nat Prod Rep. 2019 Jan 1;36(1):35-107. doi: 10.1039/c7np00064b. Epub 2018 Jul 13.
10
Experiences with a researcher-centric ELN.以研究者为中心的电子实验室笔记本的经验。
Chem Sci. 2015 Mar 1;6(3):1614-1629. doi: 10.1039/c4sc02128b. Epub 2014 Oct 20.