• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 ChemDataExtractor 自动生成的折射率和介电常数数据库。

A database of refractive indices and dielectric constants auto-generated using ChemDataExtractor.

机构信息

Cavendish Laboratory, University of Cambridge, J. J. Thomson Avenue, Cambridge, CB3 0HE, UK.

ISIS Neutron and Muon Source, Rutherford Appleton Laboratory, Harwell Science and Innovation Campus, Didcot, Oxfordshire, OX11 0QX, UK.

出版信息

Sci Data. 2022 May 3;9(1):192. doi: 10.1038/s41597-022-01295-5.

DOI:10.1038/s41597-022-01295-5
PMID:35504964
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9065060/
Abstract

The ability to auto-generate databases of optical properties holds great potential for advancing optical research, especially with regards to the data-driven discovery of optical materials. An optical property database of refractive indices and dielectric constants is presented, which comprises a total of 49,076 refractive index and 60,804 dielectric constant data records on 11,054 unique chemicals. The database was auto-generated using the state-of-the-art natural language processing software, ChemDataExtractor, using a corpus of 388,461 scientific papers. The data repository offers a representative overview of the information on linear optical properties that resides in scientific papers from the past 30 years. Public availability of these data will enable a quick search for the optical property of certain materials. The large size of this repository will accelerate data-driven research on the design and prediction of optical materials and their properties. To the best of our knowledge, this is the first auto-generated database of optical properties from a large number of scientific papers. We provide a web interface to aid the use of our database.

摘要

自动生成光学性质数据库在推动光学研究方面具有巨大的潜力,特别是在数据驱动的光学材料发现方面。本文呈现了一个折射率和介电常数的光学性质数据库,其中包含了 11054 种独特化学物质的总共 49076 个折射率和 60884 个介电常数数据记录。该数据库是使用最先进的自然语言处理软件 ChemDataExtractor,通过 388461 篇科学论文的语料库自动生成的。该数据库提供了过去 30 年科学文献中线性光学性质信息的代表性概述。这些数据的公开可用性将能够快速搜索某些材料的光学性质。该数据库的大规模将加速对光学材料及其性质的设计和预测的基于数据的研究。据我们所知,这是第一个从大量科学论文中自动生成的光学性质数据库。我们提供了一个网络界面来帮助使用我们的数据库。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/f9e93a362ccb/41597_2022_1295_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/a67cf801b7bf/41597_2022_1295_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/3a4007dbdd5b/41597_2022_1295_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/f9e93a362ccb/41597_2022_1295_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/a67cf801b7bf/41597_2022_1295_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/3a4007dbdd5b/41597_2022_1295_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1c0e/9065060/f9e93a362ccb/41597_2022_1295_Fig3_HTML.jpg

相似文献

1
A database of refractive indices and dielectric constants auto-generated using ChemDataExtractor.使用 ChemDataExtractor 自动生成的折射率和介电常数数据库。
Sci Data. 2022 May 3;9(1):192. doi: 10.1038/s41597-022-01295-5.
2
A database of battery materials auto-generated using ChemDataExtractor.使用 ChemDataExtractor 自动生成的电池材料数据库。
Sci Data. 2020 Aug 6;7(1):260. doi: 10.1038/s41597-020-00602-2.
3
A thermoelectric materials database auto-generated from the scientific literature using ChemDataExtractor.使用 ChemDataExtractor 从科学文献中自动生成的热电材料数据库。
Sci Data. 2022 Oct 22;9(1):648. doi: 10.1038/s41597-022-01752-1.
4
Auto-generated database of semiconductor band gaps using ChemDataExtractor.使用 ChemDataExtractor 自动生成半导体带隙数据库。
Sci Data. 2022 May 3;9(1):193. doi: 10.1038/s41597-022-01294-6.
5
A database of thermally activated delayed fluorescent molecules auto-generated from scientific literature with ChemDataExtractor.利用 ChemDataExtractor 从科学文献中自动生成热激活延迟荧光分子数据库。
Sci Data. 2024 Jan 17;11(1):80. doi: 10.1038/s41597-023-02897-3.
6
Auto-generated materials database of Curie and Néel temperatures via semi-supervised relationship extraction.通过半监督关系抽取技术生成居里温度和奈尔温度的自动材料数据库。
Sci Data. 2018 Jun 19;5:180111. doi: 10.1038/sdata.2018.111.
7
Comparative dataset of experimental and computational attributes of UV/vis absorption spectra.紫外/可见吸收光谱的实验和计算属性比较数据集。
Sci Data. 2019 Dec 5;6(1):307. doi: 10.1038/s41597-019-0306-0.
8
Perovskite- and Dye-Sensitized Solar-Cell Device Databases Auto-generated Using ChemDataExtractor.使用ChemDataExtractor自动生成的钙钛矿和染料敏化太阳能电池器件数据库。
Sci Data. 2022 Jun 17;9(1):329. doi: 10.1038/s41597-022-01355-w.
9
A Design-to-Device Pipeline for Data-Driven Materials Discovery.数据驱动的材料发现的设计到器件的流水线。
Acc Chem Res. 2020 Mar 17;53(3):599-610. doi: 10.1021/acs.accounts.9b00470. Epub 2020 Feb 25.
10
[Construction of chemical information database based on optical structure recognition technique].基于光学结构识别技术的化学信息数据库构建
Beijing Da Xue Xue Bao Yi Xue Ban. 2018 Apr 18;50(2):352-357.

引用本文的文献

1
Highly precise optical detection of mass destruction nerve agents based on photonic crystal fibers.基于光子晶体光纤的大规模杀伤性神经毒剂的高精度光学检测
Sci Rep. 2025 Sep 18;15(1):32609. doi: 10.1038/s41598-025-20186-4.
2
Autogenerating a Domain-Specific Question-Answering Data Set from a Thermoelectric Materials Database to Enable High-Performing BERT Models.从热电材料数据库自动生成特定领域的问答数据集以启用高性能的BERT模型。
J Chem Inf Model. 2025 Aug 25;65(16):8579-8592. doi: 10.1021/acs.jcim.5c00840. Epub 2025 Aug 7.
3
Dataset of tensorial optical and transport properties of materials from the Wannier function method.

本文引用的文献

1
ChemDataExtractor 2.0: Autopopulated Ontologies for Materials Science.ChemDataExtractor 2.0:材料科学自动填充本体。
J Chem Inf Model. 2021 Sep 27;61(9):4280-4289. doi: 10.1021/acs.jcim.1c00446. Epub 2021 Sep 16.
2
A database of battery materials auto-generated using ChemDataExtractor.使用 ChemDataExtractor 自动生成的电池材料数据库。
Sci Data. 2020 Aug 6;7(1):260. doi: 10.1038/s41597-020-00602-2.
3
A Design-to-Device Pipeline for Data-Driven Materials Discovery.数据驱动的材料发现的设计到器件的流水线。
基于万尼尔函数方法的材料张量光学与输运性质数据集。
Sci Data. 2025 Jul 1;12(1):1092. doi: 10.1038/s41597-025-05396-9.
4
Cost-Efficient Domain-Adaptive Pretraining of Language Models for Optoelectronics Applications.用于光电子应用的语言模型的经济高效领域自适应预训练
J Chem Inf Model. 2025 Mar 10;65(5):2476-2486. doi: 10.1021/acs.jcim.4c02029. Epub 2025 Feb 11.
5
MechBERT: Language Models for Extracting Chemical and Property Relationships about Mechanical Stress and Strain.MechBERT:用于提取关于机械应力和应变的化学与性质关系的语言模型。
J Chem Inf Model. 2025 Feb 24;65(4):1873-1888. doi: 10.1021/acs.jcim.4c00857. Epub 2025 Jan 31.
6
Extracting accurate materials data from research papers with conversational language models and prompt engineering.利用对话式语言模型和提示工程从研究论文中提取准确的材料数据。
Nat Commun. 2024 Feb 21;15(1):1569. doi: 10.1038/s41467-024-45914-8.
7
Structured information extraction from scientific text with large language models.利用大语言模型从科学文本中提取结构化信息。
Nat Commun. 2024 Feb 15;15(1):1418. doi: 10.1038/s41467-024-45563-x.
8
A database of thermally activated delayed fluorescent molecules auto-generated from scientific literature with ChemDataExtractor.利用 ChemDataExtractor 从科学文献中自动生成热激活延迟荧光分子数据库。
Sci Data. 2024 Jan 17;11(1):80. doi: 10.1038/s41597-023-02897-3.
9
Snowball 2.0: Generic Material Data Parser for ChemDataExtractor.雪球 2.0:ChemDataExtractor 的通用物质数据解析器。
J Chem Inf Model. 2023 Nov 27;63(22):7045-7055. doi: 10.1021/acs.jcim.3c01281. Epub 2023 Nov 7.
10
OpticalBERT and OpticalTable-SQA: Text- and Table-Based Language Models for the Optical-Materials Domain.光学 BERT 和光学 Table-SQA:面向光学材料领域的基于文本和表格的语言模型。
J Chem Inf Model. 2023 Apr 10;63(7):1961-1981. doi: 10.1021/acs.jcim.2c01259. Epub 2023 Mar 20.
Acc Chem Res. 2020 Mar 17;53(3):599-610. doi: 10.1021/acs.accounts.9b00470. Epub 2020 Feb 25.
4
Comparative dataset of experimental and computational attributes of UV/vis absorption spectra.紫外/可见吸收光谱的实验和计算属性比较数据集。
Sci Data. 2019 Dec 5;6(1):307. doi: 10.1038/s41597-019-0306-0.
5
Applications of machine learning in drug discovery and development.机器学习在药物发现和开发中的应用。
Nat Rev Drug Discov. 2019 Jun;18(6):463-477. doi: 10.1038/s41573-019-0024-5.
6
Machine learning approach for rapid and accurate estimation of optical properties using spatial frequency domain imaging.基于空间频域成像的快速准确光学特性估计的机器学习方法。
J Biomed Opt. 2018 Dec;24(7):1-6. doi: 10.1117/1.JBO.24.7.071606.
7
Auto-generated materials database of Curie and Néel temperatures via semi-supervised relationship extraction.通过半监督关系抽取技术生成居里温度和奈尔温度的自动材料数据库。
Sci Data. 2018 Jun 19;5:180111. doi: 10.1038/sdata.2018.111.
8
An open experimental database for exploring inorganic materials.一个用于探索无机材料的开放实验数据库。
Sci Data. 2018 Apr 3;5:180053. doi: 10.1038/sdata.2018.53.
9
ChemDataExtractor: A Toolkit for Automated Extraction of Chemical Information from the Scientific Literature.ChemDataExtractor:一个用于从科学文献中自动提取化学信息的工具包。
J Chem Inf Model. 2016 Oct 24;56(10):1894-1904. doi: 10.1021/acs.jcim.6b00207. Epub 2016 Oct 6.