• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

迈向医学文献中的语义角色标注与信息抽取

Towards semantic role labeling & IE in the medical literature.

作者信息

Kogan Yacov, Collier Nigel, Pakhomov Serguei, Krauthammer Michael

机构信息

Center for Medical Informatics, Yale University School of Medicine, New Haven, CT, USA.

出版信息

AMIA Annu Symp Proc. 2005;2005:410-4.

PMID:16779072
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1560806/
Abstract

INTRODUCTION

In this work, we introduce the concept of semantic role labeling to the medical domain. We report first results of porting and adapting an existing resource, Propbank, to the medical field. Propbank is an adjunct to Penn Treebank that provides semantic annotation of predicates and the roles played by their arguments. The main aim of this work is the applicability of the Propbank frame files to predicates typically encountered in the medical literature.

METHODS

We analyzed a target corpus of 610,100 abstracts, which was selected by searching for publication type "case reports". From this target corpus, we randomly selected 10,000 sample abstracts to estimate the predicate distribution, and matched the predicates from this sample to the predicates in Propbank.

RESULTS

Of the 1998 unique verbs in our sample, 76% were represented in Propbank. This included the 40 most frequent verbs, which represented 49% of all predicate instances in our sample and which matched the Propbank usage in a study of representative sentences. We propose extensions to Propbank that handle medical predicates, which are not adequately covered by Propbank.

CONCLUSION

We believe that semantic role labeling using Propbank is a valid approach to capture predicate relations in the medical literature.

摘要

引言

在本研究中,我们将语义角色标注的概念引入医学领域。我们报告了将现有资源Propbank移植并适配到医学领域的初步成果。Propbank是宾州树库的一个附属资源,它提供谓词及其论元所扮演角色的语义标注。这项工作的主要目标是使Propbank框架文件适用于医学文献中常见的谓词。

方法

我们分析了一个由610100篇摘要组成的目标语料库,这些摘要通过搜索“病例报告”的出版物类型来选取。从这个目标语料库中,我们随机抽取10000篇样本摘要来估计谓词分布,并将该样本中的谓词与Propbank中的谓词进行匹配。

结果

在我们样本中的1998个独特动词中,76%在Propbank中有对应。这包括40个最频繁出现的动词,它们占我们样本中所有谓词实例的49%,并且在一项代表性句子研究中与Propbank的用法相匹配。我们提议对Propbank进行扩展,以处理Propbank未充分涵盖的医学谓词。

结论

我们认为使用Propbank进行语义角色标注是一种有效的方法,可以捕捉医学文献中的谓词关系。

相似文献

1
Towards semantic role labeling & IE in the medical literature.迈向医学文献中的语义角色标注与信息抽取
AMIA Annu Symp Proc. 2005;2005:410-4.
2
Towards comprehensive syntactic and semantic annotations of the clinical narrative.朝着临床叙述的全面句法和语义标注努力。
J Am Med Inform Assoc. 2013 Sep-Oct;20(5):922-30. doi: 10.1136/amiajnl-2012-001317. Epub 2013 Jan 25.
3
Shallow semantic parsing of randomized controlled trial reports.随机对照试验报告的浅层语义解析
AMIA Annu Symp Proc. 2006;2006:604-8.
4
A critical review of PASBio's argument structures for biomedical verbs.对PASBio关于生物医学动词的论证结构的批判性综述。
BMC Bioinformatics. 2006 Nov 24;7 Suppl 3(Suppl 3):S5. doi: 10.1186/1471-2105-7-S3-S5.
5
Semi-automatic conversion of BioProp semantic annotation to PASBio annotation.将生物属性语义注释半自动转换为PASBio注释。
BMC Bioinformatics. 2008 Dec 12;9 Suppl 12(Suppl 12):S18. doi: 10.1186/1471-2105-9-S12-S18.
6
The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text.自然语言处理中领域知识与语言结构的相互作用:解读生物医学文本中的上位命题
J Biomed Inform. 2003 Dec;36(6):462-77. doi: 10.1016/j.jbi.2003.11.003.
7
BIOSMILE: a semantic role labeling system for biomedical verbs using a maximum-entropy model with automatically generated template features.BIOSMILE:一种用于生物医学动词的语义角色标注系统,它使用带有自动生成模板特征的最大熵模型。
BMC Bioinformatics. 2007 Sep 1;8:325. doi: 10.1186/1471-2105-8-325.
8
Using SemRep to label semantic relations extracted from clinical text.使用SemRep标记从临床文本中提取的语义关系。
AMIA Annu Symp Proc. 2012;2012:587-95. Epub 2012 Nov 3.
9
Developing a corpus of clinical notes manually annotated for part-of-speech.开发一个词性人工标注的临床笔记语料库。
Int J Med Inform. 2006 Jun;75(6):418-29. doi: 10.1016/j.ijmedinf.2005.08.006. Epub 2005 Sep 19.
10
Predicate argument structure frames for modeling information in operative notes.用于在手术记录中对信息进行建模的谓词-论元结构框架。
Stud Health Technol Inform. 2013;192:783-7.

引用本文的文献

1
Psychiatric symptom recognition without labeled data using distributional representations of phrases and on-line knowledge.使用短语的分布表示和在线知识进行无标记数据的精神症状识别。
J Biomed Inform. 2017 Nov;75S:S129-S137. doi: 10.1016/j.jbi.2017.06.014. Epub 2017 Jun 15.
2
Domain adaptation for semantic role labeling of clinical text.临床文本语义角色标注的领域适应
J Am Med Inform Assoc. 2015 Sep;22(5):967-79. doi: 10.1093/jamia/ocu048. Epub 2015 Jun 10.
3
Automating case definitions using literature-based reasoning.使用基于文献的推理自动生成病例定义。
Appl Clin Inform. 2013 Oct 30;4(4):515-27. doi: 10.4338/ACI-2013-04-RA-0028. eCollection 2013.
4
Construction of an annotated corpus to support biomedical information extraction.构建带注释语料库以支持生物医学信息抽取。
BMC Bioinformatics. 2009 Oct 23;10:349. doi: 10.1186/1471-2105-10-349.
5
Large scale application of neural network based semantic role labeling for automated relation extraction from biomedical texts.基于神经网络的语义角色标注在从生物医学文本中自动提取关系方面的大规模应用。
PLoS One. 2009 Jul 28;4(7):e6393. doi: 10.1371/journal.pone.0006393.
6
Semi-automatic conversion of BioProp semantic annotation to PASBio annotation.将生物属性语义注释半自动转换为PASBio注释。
BMC Bioinformatics. 2008 Dec 12;9 Suppl 12(Suppl 12):S18. doi: 10.1186/1471-2105-9-S12-S18.
7
Nominalization and alternations in biomedical language.生物医学语言中的名词化及变体
PLoS One. 2008 Sep 9;3(9):e3158. doi: 10.1371/journal.pone.0003158.
8
Semantic role labeling for protein transport predicates.蛋白质转运谓词的语义角色标注。
BMC Bioinformatics. 2008 Jun 11;9:277. doi: 10.1186/1471-2105-9-277.
9
Corpus annotation for mining biomedical events from literature.用于从文献中挖掘生物医学事件的语料库标注。
BMC Bioinformatics. 2008 Jan 8;9:10. doi: 10.1186/1471-2105-9-10.
10
BIOSMILE: a semantic role labeling system for biomedical verbs using a maximum-entropy model with automatically generated template features.BIOSMILE:一种用于生物医学动词的语义角色标注系统,它使用带有自动生成模板特征的最大熵模型。
BMC Bioinformatics. 2007 Sep 1;8:325. doi: 10.1186/1471-2105-8-325.

本文引用的文献

1
PASBio: predicate-argument structures for event extraction in molecular biology.PASBio:用于分子生物学事件提取的谓词-论元结构
BMC Bioinformatics. 2004 Oct 19;5:155. doi: 10.1186/1471-2105-5-155.
2
Really, is medical sublanguage that different? Experimental counter-evidence from tagging medical and newspaper corpora.真的,医学子语言有那么不同吗?来自标注医学语料库和报纸语料库的实验性反证。
Stud Health Technol Inform. 2004;107(Pt 1):560-4.
3
The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text.自然语言处理中领域知识与语言结构的相互作用:解读生物医学文本中的上位命题
J Biomed Inform. 2003 Dec;36(6):462-77. doi: 10.1016/j.jbi.2003.11.003.
4
Two biomedical sublanguages: a description based on the theories of Zellig Harris.两种生物医学子语言:基于泽利格·哈里斯理论的一种描述
J Biomed Inform. 2002 Aug;35(4):222-35. doi: 10.1016/s1532-0464(03)00012-1.
5
The sublanguage of cross-coverage.交叉覆盖的子语言
Proc AMIA Symp. 2002:742-6.
6
Exploring text mining from MEDLINE.探索来自医学文献数据库(MEDLINE)的文本挖掘。
Proc AMIA Symp. 2002:722-6.
7
MEDSYNDIKATE--a natural language system for the extraction of medical information from findings reports.MEDSYNDIKATE——一个用于从检查报告中提取医学信息的自然语言系统。
Int J Med Inform. 2002 Dec 4;67(1-3):63-74. doi: 10.1016/s1386-5056(02)00053-9.
8
A broad-coverage natural language processing system.一个具有广泛覆盖范围的自然语言处理系统。
Proc AMIA Symp. 2000:270-4.
9
Experience with a mixed semantic/syntactic parser.使用混合语义/句法解析器的经验。
Proc Annu Symp Comput Appl Med Care. 1995:284-8.