• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过本体驱动的转换和集成过程生成开放生物医学数据集。

Generation of open biomedical datasets through ontology-driven transformation and integration processes.

作者信息

Carmen Legaz-García María Del, Miñarro-Giménez José Antonio, Menárguez-Tortosa Marcos, Fernández-Breis Jesualdo Tomás

机构信息

Departamento de Informática y Sistemas, Universidad de Murcia, IMIB-Arrixaca, Murcia, 30071, Spain.

Institute of Medical Informatics, Statistics and Documentation, Medical University of Graz, Graz, 8036, Austria.

出版信息

J Biomed Semantics. 2016 Jun 3;7:32. doi: 10.1186/s13326-016-0075-z.

DOI:10.1186/s13326-016-0075-z
PMID:27255189
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4891880/
Abstract

BACKGROUND

Biomedical research usually requires combining large volumes of data from multiple heterogeneous sources, which makes difficult the integrated exploitation of such data. The Semantic Web paradigm offers a natural technological space for data integration and exploitation by generating content readable by machines. Linked Open Data is a Semantic Web initiative that promotes the publication and sharing of data in machine readable semantic formats.

METHODS

We present an approach for the transformation and integration of heterogeneous biomedical data with the objective of generating open biomedical datasets in Semantic Web formats. The transformation of the data is based on the mappings between the entities of the data schema and the ontological infrastructure that provides the meaning to the content. Our approach permits different types of mappings and includes the possibility of defining complex transformation patterns. Once the mappings are defined, they can be automatically applied to datasets to generate logically consistent content and the mappings can be reused in further transformation processes.

RESULTS

The results of our research are (1) a common transformation and integration process for heterogeneous biomedical data; (2) the application of Linked Open Data principles to generate interoperable, open, biomedical datasets; (3) a software tool, called SWIT, that implements the approach. In this paper we also describe how we have applied SWIT in different biomedical scenarios and some lessons learned.

CONCLUSIONS

We have presented an approach that is able to generate open biomedical repositories in Semantic Web formats. SWIT is able to apply the Linked Open Data principles in the generation of the datasets, so allowing for linking their content to external repositories and creating linked open datasets. SWIT datasets may contain data from multiple sources and schemas, thus becoming integrated datasets.

摘要

背景

生物医学研究通常需要整合来自多个异构源的大量数据,这使得对这些数据的综合利用变得困难。语义网范式通过生成机器可读的内容,为数据集成和利用提供了一个自然的技术空间。关联开放数据是一项语义网倡议,旨在促进以机器可读的语义格式发布和共享数据。

方法

我们提出了一种用于异构生物医学数据转换和集成的方法,目标是以语义网格式生成开放的生物医学数据集。数据转换基于数据模式实体与为内容提供意义的本体基础设施之间的映射。我们的方法允许不同类型的映射,并包括定义复杂转换模式的可能性。一旦定义了映射,就可以自动将其应用于数据集以生成逻辑一致的内容,并且这些映射可以在进一步的转换过程中重复使用。

结果

我们的研究结果是:(1)异构生物医学数据的通用转换和集成过程;(2)应用关联开放数据原则生成可互操作、开放的生物医学数据集;(3)一个名为SWIT的软件工具,它实现了该方法。在本文中,我们还描述了我们如何在不同的生物医学场景中应用SWIT以及一些经验教训。

结论

我们提出了一种能够以语义网格式生成开放生物医学知识库的方法。SWIT能够在数据集生成过程中应用关联开放数据原则,从而允许将其内容链接到外部知识库并创建关联开放数据集。SWIT数据集可能包含来自多个源和模式的数据,从而成为集成数据集。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/043e72684f6a/13326_2016_75_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/a639efdc77c8/13326_2016_75_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/039cdc37fc1d/13326_2016_75_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/7ccd80db2604/13326_2016_75_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/e685f49d2e19/13326_2016_75_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/043e72684f6a/13326_2016_75_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/a639efdc77c8/13326_2016_75_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/039cdc37fc1d/13326_2016_75_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/7ccd80db2604/13326_2016_75_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/e685f49d2e19/13326_2016_75_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f757/4891880/043e72684f6a/13326_2016_75_Fig5_HTML.jpg

相似文献

1
Generation of open biomedical datasets through ontology-driven transformation and integration processes.通过本体驱动的转换和集成过程生成开放生物医学数据集。
J Biomed Semantics. 2016 Jun 3;7:32. doi: 10.1186/s13326-016-0075-z.
2
Lessons learned in the generation of biomedical research datasets using Semantic Open Data technologies.使用语义开放数据技术生成生物医学研究数据集的经验教训。
Stud Health Technol Inform. 2015;210:165-9.
3
KaBOB: ontology-based semantic integration of biomedical databases.KaBOB:基于本体的生物医学数据库语义集成
BMC Bioinformatics. 2015 Apr 23;16(1):126. doi: 10.1186/s12859-015-0559-3.
4
Linked Data Applications Through Ontology Based Data Access in Clinical Research.通过基于本体的数据访问在临床研究中的关联数据应用。
Stud Health Technol Inform. 2017;235:131-135.
5
Toward a view-oriented approach for aligning RDF-based biomedical repositories.迈向一种基于视图的方法来对齐基于RDF的生物医学知识库。
Methods Inf Med. 2015;54(1):50-5. doi: 10.3414/ME13-02-0020. Epub 2014 Apr 29.
6
Linked open data-based framework for automatic biomedical ontology generation.基于链接开放数据的自动生物医学本体生成框架。
BMC Bioinformatics. 2018 Sep 10;19(1):319. doi: 10.1186/s12859-018-2339-3.
7
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.
8
Semantic Technologies and Bio-Ontologies.语义技术与生物本体论
Methods Mol Biol. 2017;1617:83-91. doi: 10.1007/978-1-4939-7046-9_6.
9
Transformation of standardized clinical models based on OWL technologies: from CEM to OpenEHR archetypes.基于OWL技术的标准化临床模型转换:从CEM到OpenEHR原型
J Am Med Inform Assoc. 2015 May;22(3):536-44. doi: 10.1093/jamia/ocu027. Epub 2015 Feb 10.
10
Wikidata: A large-scale collaborative ontological medical database.Wikidata:一个大规模的协作本体医学数据库。
J Biomed Inform. 2019 Nov;99:103292. doi: 10.1016/j.jbi.2019.103292. Epub 2019 Sep 23.

引用本文的文献

1
An epidemiological knowledge graph extracted from the World Health Organization's Disease Outbreak News.从世界卫生组织疾病暴发新闻中提取的流行病学知识图谱。
Sci Data. 2025 Jun 10;12(1):970. doi: 10.1038/s41597-025-05276-2.
2
Representation of chemistry transport models simulations using knowledge graphs.使用知识图谱表示化学传输模型模拟
J Cheminform. 2025 May 31;17(1):91. doi: 10.1186/s13321-025-01025-0.
3
Use of Metadata-Driven Approaches for Data Harmonization in the Medical Domain: Scoping Review.医学领域中使用元数据驱动方法进行数据协调:范围综述

本文引用的文献

1
Transformation of standardized clinical models based on OWL technologies: from CEM to OpenEHR archetypes.基于OWL技术的标准化临床模型转换:从CEM到OpenEHR原型
J Am Med Inform Assoc. 2015 May;22(3):536-44. doi: 10.1093/jamia/ocu027. Epub 2015 Feb 10.
2
The 2015 Nucleic Acids Research Database Issue and molecular biology database collection.《核酸研究》2015年数据库专刊及分子生物学数据库合集。
Nucleic Acids Res. 2015 Jan;43(Database issue):D1-5. doi: 10.1093/nar/gku1241.
3
Ontology content patterns as bridge for the semantic representation of clinical information.
JMIR Med Inform. 2024 Feb 14;12:e52967. doi: 10.2196/52967.
4
The Semantic Data Dictionary - An Approach for Describing and Annotating Data.语义数据字典——一种描述和注释数据的方法。
Data Intell. 2020 Fall;2(4):443-486. doi: 10.1162/dint_a_00058. Epub 2020 Oct 22.
5
BioHackathon 2015: Semantics of data for life sciences and reproducible research.2015 年生物黑客马拉松:生命科学和可重复研究的数据语义学。
F1000Res. 2020 Feb 24;9:136. doi: 10.12688/f1000research.18236.1. eCollection 2020.
6
Long-term preservation of biomedical research data.生物医学研究数据的长期保存
F1000Res. 2018 Aug 29;7:1353. doi: 10.12688/f1000research.16015.1. eCollection 2018.
7
Linked open data-based framework for automatic biomedical ontology generation.基于链接开放数据的自动生物医学本体生成框架。
BMC Bioinformatics. 2018 Sep 10;19(1):319. doi: 10.1186/s12859-018-2339-3.
8
Analysis and visualization of disease courses in a semantically-enabled cancer registry.在语义增强型癌症登记处对疾病病程进行分析和可视化。
J Biomed Semantics. 2017 Sep 29;8(1):46. doi: 10.1186/s13326-017-0154-9.
9
Semantic annotation in biomedicine: the current landscape.生物医学中的语义标注:现状
J Biomed Semantics. 2017 Sep 22;8(1):44. doi: 10.1186/s13326-017-0153-x.
10
PIBAS FedSPARQL: a web-based platform for integration and exploration of bioinformatics datasets.PIBAS FedSPARQL:一个用于生物信息学数据集整合与探索的基于网络的平台。
J Biomed Semantics. 2017 Sep 20;8(1):42. doi: 10.1186/s13326-017-0151-z.
本体内容模式作为临床信息语义表示的桥梁。
Appl Clin Inform. 2014 Jul 23;5(3):660-9. doi: 10.4338/ACI-2014-04-RA-0031. eCollection 2014.
4
Contribution of Clinical Archetypes, and the Challenges, towards Achieving Semantic Interoperability for EHRs.临床原型对实现电子健康记录语义互操作性的贡献及挑战
Healthc Inform Res. 2013 Dec;19(4):286-92. doi: 10.4258/hir.2013.19.4.286. Epub 2013 Dec 31.
5
The EBI RDF platform: linked open data for the life sciences.EBI RDF 平台:生命科学领域的关联开放数据。
Bioinformatics. 2014 May 1;30(9):1338-9. doi: 10.1093/bioinformatics/btt765. Epub 2014 Jan 11.
6
Leveraging electronic healthcare record standards and semantic web technologies for the identification of patient cohorts.利用电子医疗记录标准和语义网技术来确定患者队列。
J Am Med Inform Assoc. 2013 Dec;20(e2):e288-96. doi: 10.1136/amiajnl-2013-001923. Epub 2013 Aug 9.
7
The next-generation electronic health record: perspectives of key leaders from the US Department of Veterans Affairs.下一代电子健康记录:来自美国退伍军人事务部的主要领导人的观点。
J Am Med Inform Assoc. 2013 Jun;20(e1):e175-7. doi: 10.1136/amiajnl-2013-001748. Epub 2013 Apr 18.
8
A semantic-web oriented representation of the clinical element model for secondary use of electronic health records data.面向电子健康记录数据二次使用的临床元素模型的语义 Web 表示。
J Am Med Inform Assoc. 2013 May 1;20(3):554-62. doi: 10.1136/amiajnl-2012-001326. Epub 2012 Dec 25.
9
The coming age of data-driven medicine: translational bioinformatics' next frontier.数据驱动医学的新时代:转化生物信息学的下一个前沿领域。
J Am Med Inform Assoc. 2012 Jun;19(e1):e2-4. doi: 10.1136/amiajnl-2012-000969.
10
ZINC: a free tool to discover chemistry for biology.ZINC:一款用于生物学的免费化学发现工具。
J Chem Inf Model. 2012 Jul 23;52(7):1757-68. doi: 10.1021/ci3001277. Epub 2012 Jun 15.