Suppr超能文献

基于语料库的语义类别的识别与细化。

Corpus-based identification and refinement of semantic classes.

作者信息

Nazarenko A, Zweigenbaum P, Bouaud J, Habert B

机构信息

Laboratoire d'Informatique de Paris-Nord, Université Paris 13.

出版信息

Proc AMIA Annu Fall Symp. 1997:585-9.

Abstract

Medical Language Processing (MLP), especially in specific domains, requires fine-grained semantic lexica. We examine whether robust natural language processing tools used on a representative corpus of a domain help in building and refining a semantic categorization. We test this hypothesis with ZELLIG, a corpus analysis tool. The first clusters we obtain are consistent with a model of the domain, as found in the SNOMED nomenclature. They correspond to coarse-grained semantic categories, but isolate as well lexical idiosyncrasies belonging to the clinical sub-language. Moreover, they help categorize additional words.

摘要

医学语言处理(MLP),尤其是在特定领域,需要细粒度的语义词典。我们研究在一个领域的代表性语料库上使用强大的自然语言处理工具是否有助于构建和完善语义分类。我们使用语料库分析工具ZELLIG来检验这一假设。我们得到的第一批聚类与该领域的一个模型一致,如在SNOMED术语表中所发现的。它们对应于粗粒度的语义类别,但也分离出了属于临床子语言的词汇特性。此外,它们有助于对其他单词进行分类。

相似文献

7
The nature of lexical knowledge.词汇知识的本质。
Methods Inf Med. 1998 Nov;37(4-5):353-60.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验