• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

UMLS 内容视图适合于生物医学文献与临床文本的自然语言处理。

UMLS content views appropriate for NLP processing of the biomedical literature vs. clinical text.

机构信息

Lister Hill National Center for Biomedical Communications (LHNCBC), U.S. National Library of Medicine, National Institutes of Health, Bethesda, MD 20894, USA.

出版信息

J Biomed Inform. 2010 Aug;43(4):587-94. doi: 10.1016/j.jbi.2010.02.005. Epub 2010 Feb 10.

DOI:10.1016/j.jbi.2010.02.005
PMID:20152935
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2890296/
Abstract

Identification of medical terms in free text is a first step in such Natural Language Processing (NLP) tasks as automatic indexing of biomedical literature and extraction of patients' problem lists from the text of clinical notes. Many tools developed to perform these tasks use biomedical knowledge encoded in the Unified Medical Language System (UMLS) Metathesaurus. We continue our exploration of automatic approaches to creation of subsets (UMLS content views) which can support NLP processing of either the biomedical literature or clinical text. We found that suppression of highly ambiguous terms in the conservative AutoFilter content view can partially replace manual filtering for literature applications, and suppression of two character mappings in the same content view achieves 89.5% precision at 78.6% recall for clinical applications.

摘要

在自然语言处理(NLP)任务中,例如自动索引生物医学文献和从临床记录的文本中提取患者的问题列表,识别自由文本中的医学术语是第一步。许多用于执行这些任务的工具都使用统一医学语言系统(UMLS)Metathesaurus 中编码的生物医学知识。我们继续探索自动方法来创建子集(UMLS 内容视图),这些子集可以支持 NLP 处理生物医学文献或临床文本。我们发现,在保守的 AutoFilter 内容视图中抑制高度模糊的术语可以部分替代文献应用程序的手动过滤,并且在同一内容视图中抑制两个字符映射可以实现临床应用程序 78.6%召回率时达到 89.5%的精度。

相似文献

1
UMLS content views appropriate for NLP processing of the biomedical literature vs. clinical text.UMLS 内容视图适合于生物医学文献与临床文本的自然语言处理。
J Biomed Inform. 2010 Aug;43(4):587-94. doi: 10.1016/j.jbi.2010.02.005. Epub 2010 Feb 10.
2
Methodology for creating UMLS content views appropriate for biomedical natural language processing.创建适用于生物医学自然语言处理的统一医学语言系统(UMLS)内容视图的方法。
AMIA Annu Symp Proc. 2008 Nov 6;2008:21-5.
3
A Comprehensive Analysis of Five Million UMLS Metathesaurus Terms Using Eighteen Million MEDLINE Citations.使用一千八百万条MEDLINE引文对五百万条统一医学语言系统(UMLS)元词表术语进行的综合分析。
AMIA Annu Symp Proc. 2010 Nov 13;2010:907-11.
4
Effective mapping of biomedical text to the UMLS Metathesaurus: the MetaMap program.生物医学文本到UMLS元词表的有效映射:MetaMap程序
Proc AMIA Symp. 2001:17-21.
5
UMLS knowledge for biomedical language processing.用于生物医学语言处理的统一医学语言系统知识。
Bull Med Libr Assoc. 1993 Apr;81(2):184-94.
6
Use of "off-the-shelf" information extraction algorithms in clinical informatics: A feasibility study of MetaMap annotation of Italian medical notes.临床信息学中“现成可用”信息提取算法的应用:意大利医学记录的MetaMap注释可行性研究。
J Biomed Inform. 2016 Oct;63:22-32. doi: 10.1016/j.jbi.2016.07.017. Epub 2016 Jul 18.
7
The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text.自然语言处理中领域知识与语言结构的相互作用:解读生物医学文本中的上位命题
J Biomed Inform. 2003 Dec;36(6):462-77. doi: 10.1016/j.jbi.2003.11.003.
8
UMLS-Query: a perl module for querying the UMLS.UMLS查询:一个用于查询统一医学语言系统(UMLS)的Perl模块。
AMIA Annu Symp Proc. 2008 Nov 6;2008:652-6.
9
UMLS-based data augmentation for natural language processing of clinical research literature.基于 UMLS 的临床研究文献自然语言处理的数据增强。
J Am Med Inform Assoc. 2021 Mar 18;28(4):812-823. doi: 10.1093/jamia/ocaa309.
10
Automatically Detecting Failures in Natural Language Processing Tools for Online Community Text.自动检测在线社区文本自然语言处理工具中的故障。
J Med Internet Res. 2015 Aug 31;17(8):e212. doi: 10.2196/jmir.4612.

引用本文的文献

1
Identifying Medical Concepts and Semantic Types in Lay Vocabularies of Health Consumers Who are Concerned with Diabetes on Social Media Using the UMLS and NLP.使用统一医学语言系统(UMLS)和自然语言处理(NLP)在社交媒体上关注糖尿病的健康消费者的日常词汇中识别医学概念和语义类型。
Proc COMPSAC. 2024 Jul;2024:862-869. doi: 10.1109/compsac61105.2024.00119. Epub 2024 Aug 26.
2
The suitability of UMLS and SNOMED-CT for encoding outcome concepts.UMLS 和 SNOMED-CT 用于编码结局概念的适宜性。
J Am Med Inform Assoc. 2023 Nov 17;30(12):1895-1903. doi: 10.1093/jamia/ocad161.
3
A case study in applying artificial intelligence-based named entity recognition to develop an automated ophthalmic disease registry.应用基于人工智能的命名实体识别技术开发自动化眼科疾病登记系统的案例研究。
Graefes Arch Clin Exp Ophthalmol. 2023 Nov;261(11):3335-3344. doi: 10.1007/s00417-023-06190-2. Epub 2023 Aug 3.
4
When BERT meets Bilbo: a learning curve analysis of pretrained language model on disease classification.当 BERT 遇见比尔博:预训练语言模型在疾病分类上的学习曲线分析。
BMC Med Inform Decis Mak. 2022 Apr 5;21(Suppl 9):377. doi: 10.1186/s12911-022-01829-2.
5
User testing of a diagnostic decision support system with machine-assisted chart review to facilitate clinical genomic diagnosis.使用机器辅助图表审查对诊断决策支持系统进行用户测试,以促进临床基因组诊断。
BMJ Health Care Inform. 2021 May;28(1). doi: 10.1136/bmjhci-2021-100331.
6
Broad-coverage biomedical relation extraction with SemRep.基于 SemRep 的广谱生物医学关系抽取。
BMC Bioinformatics. 2020 May 14;21(1):188. doi: 10.1186/s12859-020-3517-7.
7
Enhanced Quality Measurement Event Detection: An Application to Physician Reporting.增强型质量测量事件检测:在医生报告中的应用
EGEMS (Wash DC). 2017 May 30;5(1):5. doi: 10.13063/2327-9214.1270.
8
Domain adaptation for semantic role labeling of clinical text.临床文本语义角色标注的领域适应
J Am Med Inform Assoc. 2015 Sep;22(5):967-79. doi: 10.1093/jamia/ocu048. Epub 2015 Jun 10.
9
Concept selection for phenotypes and diseases using learn to rank.使用排序学习法进行表型和疾病的概念选择。
J Biomed Semantics. 2015 Jun 1;6:24. doi: 10.1186/s13326-015-0019-z. eCollection 2015.
10
TextHunter--A User Friendly Tool for Extracting Generic Concepts from Free Text in Clinical Research.TextHunter——一种从临床研究中的自由文本提取通用概念的用户友好工具。
AMIA Annu Symp Proc. 2014 Nov 14;2014:729-38. eCollection 2014.

本文引用的文献

1
Word Sense Disambiguation by Selecting the Best Semantic Type Based on Journal Descriptor Indexing: Preliminary Experiment.基于期刊描述符索引选择最佳语义类型的词义消歧:初步实验
J Am Soc Inf Sci Technol. 2006 Jan 1;57(1):96-113. doi: 10.1002/asi.20257.
2
The potential for automated question answering in the context of genomic medicine: an assessment of existing resources and properties of answers.基因组医学背景下自动化问答的潜力:对现有资源和答案属性的评估。
BMC Bioinformatics. 2009 Sep 17;10 Suppl 9(Suppl 9):S8. doi: 10.1186/1471-2105-10-S9-S8.
3
Biomedical word sense disambiguation with ontologies and metadata: automation meets accuracy.利用本体和元数据进行生物医学词义消歧:自动化与准确性的结合。
BMC Bioinformatics. 2009 Jan 21;10:28. doi: 10.1186/1471-2105-10-28.
4
Disambiguation of biomedical text using diverse sources of information.利用多种信息来源对生物医学文本进行消歧。
BMC Bioinformatics. 2008 Nov 19;9 Suppl 11(Suppl 11):S7. doi: 10.1186/1471-2105-9-S11-S7.
5
Methodology for creating UMLS content views appropriate for biomedical natural language processing.创建适用于生物医学自然语言处理的统一医学语言系统(UMLS)内容视图的方法。
AMIA Annu Symp Proc. 2008 Nov 6;2008:21-5.
6
Automated de-identification of free-text medical records.自由文本医疗记录的自动去识别化
BMC Med Inform Decis Mak. 2008 Jul 24;8:32. doi: 10.1186/1472-6947-8-32.
7
Towards a semantic lexicon for biological language processing.迈向用于生物语言处理的语义词汇表。
Comp Funct Genomics. 2005;6(1-2):61-6. doi: 10.1002/cfg.451.
8
Word sense disambiguation across two domains: biomedical literature and clinical notes.跨两个领域的词义消歧:生物医学文献和临床记录。
J Biomed Inform. 2008 Dec;41(6):1088-100. doi: 10.1016/j.jbi.2008.02.003. Epub 2008 Mar 4.
9
Machine learning and word sense disambiguation in the biomedical domain: design and evaluation issues.生物医学领域中的机器学习与词义消歧:设计与评估问题
BMC Bioinformatics. 2006 Jul 5;7:334. doi: 10.1186/1471-2105-7-334.
10
Word sense disambiguation in the biomedical domain: an overview.生物医学领域的词义消歧:综述
J Comput Biol. 2005 Jun;12(5):554-65. doi: 10.1089/cmb.2005.12.554.