• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一个支持电子健康知识发现技术的语料库。

A corpus to support eHealth Knowledge Discovery technologies.

机构信息

Department of Artificial Intelligence and Computing Systems, University of Havana, San Lázaro y L. Edificio Felipe Poey, Plaza de la Revolución, Havana, Cuba.

Department of Software and Computing Systems, University of Alicante, Carretera San Vicente del Raspeig s/n, 03690 Alicante, Spain.

出版信息

J Biomed Inform. 2019 Jun;94:103172. doi: 10.1016/j.jbi.2019.103172. Epub 2019 Apr 6.

DOI:10.1016/j.jbi.2019.103172
PMID:30965136
Abstract

This paper presents and describes eHealth-KD corpus. The corpus is a collection of 1173 Spanish health-related sentences manually annotated with a general semantic structure that captures most of the content, without resorting to domain-specific labels. The semantic representation is first defined and illustrated with example sentences from the corpus. Next, the paper summarizes the process of annotation and provides key metrics of the corpus. Finally, three baseline implementations, which are supported by machine learning models, were designed to consider the complexity of learning the corpus semantics. The resulting corpus was used as an evaluation scenario in TASS 2018 (Martínez-Cámara et al., 2018) and the findings obtained by participants are discussed. The eHealth-KD corpus provides the first step in the design of a general-purpose semantic framework that can be used to extract knowledge from a variety of domains.

摘要

本文介绍并描述了 eHealth-KD 语料库。该语料库是一个包含 1173 个西班牙语健康相关句子的集合,这些句子经过人工标注,具有捕捉大部分内容的通用语义结构,而无需使用特定于领域的标签。首先,通过来自语料库的示例句子定义并说明语义表示。接下来,本文总结了标注过程并提供了语料库的关键指标。最后,设计了三个基于机器学习模型的基线实现,以考虑学习语料库语义的复杂性。所得到的语料库被用作 TASS 2018(Martínez-Cámara 等人,2018)中的评估场景,讨论了参与者获得的发现。eHealth-KD 语料库为设计一个通用语义框架提供了第一步,该框架可用于从各种领域中提取知识。

相似文献

1
A corpus to support eHealth Knowledge Discovery technologies.一个支持电子健康知识发现技术的语料库。
J Biomed Inform. 2019 Jun;94:103172. doi: 10.1016/j.jbi.2019.103172. Epub 2019 Apr 6.
2
A computational ecosystem to support eHealth Knowledge Discovery technologies in Spanish.一个支持西班牙语电子健康知识发现技术的计算生态系统。
J Biomed Inform. 2020 Sep;109:103517. doi: 10.1016/j.jbi.2020.103517. Epub 2020 Jul 24.
3
A graph-based recovery and decomposition of Swanson's hypothesis using semantic predications.基于图的 Swanson 假说恢复和分解,使用语义谓词。
J Biomed Inform. 2013 Apr;46(2):238-51. doi: 10.1016/j.jbi.2012.09.004. Epub 2012 Sep 28.
4
Using data-driven sublanguage pattern mining to induce knowledge models: application in medical image reports knowledge representation.利用数据驱动的子语言模式挖掘来诱导知识模型:在医学图像报告知识表示中的应用。
BMC Med Inform Decis Mak. 2018 Jul 6;18(1):61. doi: 10.1186/s12911-018-0645-3.
5
RCorp: a resource for chemical disease semantic extraction in Chinese.RCorp:一个用于中文化学疾病语义提取的资源。
BMC Med Inform Decis Mak. 2019 Dec 5;19(Suppl 5):234. doi: 10.1186/s12911-019-0936-3.
6
Coreference annotation and resolution in the Colorado Richly Annotated Full Text (CRAFT) corpus of biomedical journal articles.科罗拉多生物医学期刊文章丰富注释全文(CRAFT)语料库中的共指标注与消解
BMC Bioinformatics. 2017 Aug 17;18(1):372. doi: 10.1186/s12859-017-1775-9.
7
Automatic extension of corpora from the intelligent ensembling of eHealth knowledge discovery systems outputs.电子健康知识发现系统输出的智能集成自动扩展语料库。
J Biomed Inform. 2021 Apr;116:103716. doi: 10.1016/j.jbi.2021.103716. Epub 2021 Feb 26.
8
From Web to RheumaLpack: Creating a Linguistic Corpus for Exploitation and Knowledge Discovery in Rheumatology.从 Web 到 RheumaLpack:创建用于风湿病学开发和知识发现的语言学语料库。
Comput Biol Med. 2024 Sep;179:108920. doi: 10.1016/j.compbiomed.2024.108920. Epub 2024 Jul 23.
9
A probabilistic semantic analysis of eHealth scientific literature.电子健康科学文献的概率语义分析。
J Telemed Telecare. 2020 Aug-Sep;26(7-8):414-432. doi: 10.1177/1357633X19846252. Epub 2019 May 12.
10
Building a comprehensive syntactic and semantic corpus of Chinese clinical texts.构建中文临床文本的综合句法和语义语料库。
J Biomed Inform. 2017 May;69:203-217. doi: 10.1016/j.jbi.2017.04.006. Epub 2017 Apr 9.

引用本文的文献

1
Using logical constraints to validate statistical information about disease outbreaks in collaborative knowledge graphs: the case of COVID-19 epidemiology in Wikidata.使用逻辑约束来验证协作知识图谱中有关疾病爆发的统计信息:以维基数据中的COVID-19流行病学为例。
PeerJ Comput Sci. 2022 Sep 29;8:e1085. doi: 10.7717/peerj-cs.1085. eCollection 2022.
2
A clinical trials corpus annotated with UMLS entities to enhance the access to evidence-based medicine.一个用统一医学语言系统(UMLS)实体注释的临床试验语料库,以加强对循证医学的获取。
BMC Med Inform Decis Mak. 2021 Feb 22;21(1):69. doi: 10.1186/s12911-021-01395-z.
3
A computational ecosystem to support eHealth Knowledge Discovery technologies in Spanish.
一个支持西班牙语电子健康知识发现技术的计算生态系统。
J Biomed Inform. 2020 Sep;109:103517. doi: 10.1016/j.jbi.2020.103517. Epub 2020 Jul 24.