• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于为MEDLINE索引选择文章的高召回率分类器。

A High Recall Classifier for Selecting Articles for MEDLINE Indexing.

作者信息

Rae Alastair R, Savery Max E, Mork James G, Demner-Fushman Dina

机构信息

Lister Hill National Center for Biomedical Communications, National Library of Medicine, Bethesda, MD.

出版信息

AMIA Annu Symp Proc. 2020 Mar 4;2019:727-734. eCollection 2019.

PMID:32308868
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7153058/
Abstract

MEDLINE is the National Library of Medicine's premier bibliographic database for biomedical literature. A highly valuable feature of the database is that each record is manually indexed with a controlled vocabulary called MeSH. Most MEDLINE journals are indexed cover-to-cover, but there are about 200 selectively indexed journals for which only articles related to biomedicine and life sciences are indexed. In recent years, the selection process has become an increasing burden for indexing staff, and this paper presents a machine learning based system that offers very significant time savings by semi-automating the task. At the core of the system is a high recall classifier for the identification of journal articles that are in-scope for MEDLINE. The system is shown to reduce the number of articles requiring manual review by 54%, equivalent to approximately 40,000 articles per year.

摘要

医学文献数据库(MEDLINE)是美国国立医学图书馆用于生物医学文献的首要书目数据库。该数据库的一个极具价值的特点是,每条记录都使用一种称为医学主题词表(MeSH)的受控词汇进行人工索引。大多数MEDLINE期刊都进行了全面索引,但约有200种期刊是选择性索引,仅索引与生物医学和生命科学相关的文章。近年来,筛选过程给索引编制人员带来了越来越大的负担,本文介绍了一种基于机器学习的系统,该系统通过半自动化任务显著节省了时间。该系统的核心是一个高召回率分类器,用于识别属于MEDLINE收录范围的期刊文章。该系统被证明可将需要人工审核的文章数量减少54%,相当于每年约40000篇文章。

相似文献

1
A High Recall Classifier for Selecting Articles for MEDLINE Indexing.一种用于为MEDLINE索引选择文章的高召回率分类器。
AMIA Annu Symp Proc. 2020 Mar 4;2019:727-734. eCollection 2019.
2
Influence of automated indexing in Medical Subject Headings (MeSH) selection for pharmacy practice journals.自动化索引对药学实践期刊的医学主题词(MeSH)选择的影响。
Res Social Adm Pharm. 2024 Sep;20(9):911-917. doi: 10.1016/j.sapharm.2024.06.003. Epub 2024 Jun 12.
3
Automatic MeSH Indexing: Revisiting the Subheading Attachment Problem.自动主题词标引:重新审视副主题词附着问题。
AMIA Annu Symp Proc. 2021 Jan 25;2020:1031-1040. eCollection 2020.
4
Quality of pharmacy-specific Medical Subject Headings (MeSH) assignment in pharmacy journals indexed in MEDLINE.MEDLINE收录的药学杂志中特定药学医学主题词(MeSH)标注的质量
Res Social Adm Pharm. 2015 Sep-Oct;11(5):686-95. doi: 10.1016/j.sapharm.2014.11.004. Epub 2014 Nov 22.
5
MeSH indexing based on automatically generated summaries.基于自动生成的摘要进行 MeSH 标引。
BMC Bioinformatics. 2013 Jun 26;14:208. doi: 10.1186/1471-2105-14-208.
6
MeSHProbeNet: a self-attentive probe net for MeSH indexing.MeSHProbeNet:一种用于 MeSH 索引的自注意探针网络。
Bioinformatics. 2019 Oct 1;35(19):3794-3802. doi: 10.1093/bioinformatics/btz142.
7
Semi-automatic indexing of full text biomedical articles.全文生物医学文献的半自动索引编制
AMIA Annu Symp Proc. 2005;2005:271-5.
8
Gene indexing: characterization and analysis of NLM's GeneRIFs.基因索引:美国国立医学图书馆基因相关信息摘要(GeneRIFs)的特征与分析
AMIA Annu Symp Proc. 2003;2003:460-4.
9
Understanding and using the medical subject headings (MeSH) vocabulary to perform literature searches.理解并使用医学主题词表(MeSH)词汇进行文献检索。
JAMA. 1994 Apr 13;271(14):1103-8.
10
A recent advance in the automatic indexing of the biomedical literature.生物医学文献自动标引的最新进展。
J Biomed Inform. 2009 Oct;42(5):814-23. doi: 10.1016/j.jbi.2008.12.007. Epub 2008 Dec 30.

引用本文的文献

1
Information Retrieval Using Machine Learning for Biomarker Curation in the Exposome-Explorer.在暴露组探索者中使用机器学习进行生物标志物整理的信息检索
Front Res Metr Anal. 2021 Aug 19;6:689264. doi: 10.3389/frma.2021.689264. eCollection 2021.
2
Automatic MeSH Indexing: Revisiting the Subheading Attachment Problem.自动主题词标引:重新审视副主题词附着问题。
AMIA Annu Symp Proc. 2021 Jan 25;2020:1031-1040. eCollection 2020.

本文引用的文献

1
Automatic identification of recent high impact clinical articles in PubMed to support clinical decision making using time-agnostic features.使用与时间无关的特征自动识别 PubMed 中最近具有高影响力的临床文章,以支持临床决策。
J Biomed Inform. 2019 Jan;89:1-10. doi: 10.1016/j.jbi.2018.11.010. Epub 2018 Nov 22.
2
A Deep Learning Method to Automatically Identify Reports of Scientifically Rigorous Clinical Research from the Biomedical Literature: Comparative Analytic Study.一种从生物医学文献中自动识别科学严谨的临床研究报告的深度学习方法:比较分析研究。
J Med Internet Res. 2018 Jun 25;20(6):e10281. doi: 10.2196/10281.
3
12 years on - Is the NLM medical text indexer still useful and relevant?十二年过去了——国立医学图书馆医学文本索引工具仍然有用吗?它还适用吗?
J Biomed Semantics. 2017 Feb 23;8(1):8. doi: 10.1186/s13326-017-0113-5.
4
DeepMeSH: deep semantic representation for improving large-scale MeSH indexing.深度医学主题词表:用于改进大规模医学主题词表索引的深度语义表示。
Bioinformatics. 2016 Jun 15;32(12):i70-i79. doi: 10.1093/bioinformatics/btw294.
5
Collaborative biocuration--text-mining development task for document prioritization for curation.协作生物注释——用于文档优先级排序的文本挖掘开发任务,以便进行注释。
Database (Oxford). 2012 Nov 22;2012:bas037. doi: 10.1093/database/bas037. Print 2012.
6
Towards automatic recognition of scientifically rigorous clinical research evidence.迈向科学严谨临床研究证据的自动识别。
J Am Med Inform Assoc. 2009 Jan-Feb;16(1):25-31. doi: 10.1197/jamia.M2996. Epub 2008 Oct 24.
7
Journal descriptor indexing tool for categorizing text according to discipline or semantic type.用于根据学科或语义类型对文本进行分类的期刊描述符索引工具。
AMIA Annu Symp Proc. 2006;2006:960.
8
The TREC 2004 genomics track categorization task: classifying full text biomedical documents.2004年文本检索会议(TREC)基因组学专题分类任务:对生物医学全文文档进行分类。
J Biomed Discov Collab. 2006 Mar 14;1:4. doi: 10.1186/1747-5333-1-4.