Suppr超能文献

使用图形数据库来表示和分析癌症研究数据标准映射中的挑战。

Challenges in Using a Graph Database to Represent and Analyze Mappings of Cancer Study Data Standards.

作者信息

Renner Robinette, Jiang Guoqian

机构信息

University of San Francisco, San Francisco, CA.

Mayo Clinic, Rochester, MN, USA.

出版信息

AMIA Jt Summits Transl Sci Proc. 2020 May 30;2020:517-526. eCollection 2020.

Abstract

While using data standards can facilitate research by making it easier to share data, manually mapping to data standards creates an obstacle to their adoption. Semi-automated mapping strategies can reduce the manual mapping burden. Machine learning approaches, such as artificial neural networks, can predict mappings between clinical data standards but are limited by the need for training data. We developed a graph database that incorporates the Biomedical Research Integrated Domain Group (BRIDG) model, Common Data Elements (CDEs) from the National Cancer Institute's (NCI) cancer Data Standards Registry and Repository, and the NCI Thesaurus. We then used a shortest path algorithm to predict mappings from CDEs to classes in the BRIDG model. The resulting graph database provides a robust semantic framework for analysis and quality assurance testing. Using the graph database to predict CDE to BRIDG class mappings was limited by the subjective nature of mapping and data quality issues.

摘要

虽然使用数据标准可以通过使数据共享更容易来促进研究,但手动映射到数据标准会阻碍其采用。半自动映射策略可以减轻手动映射负担。机器学习方法,如人工神经网络,可以预测临床数据标准之间的映射,但受到训练数据需求的限制。我们开发了一个图形数据库,它整合了生物医学研究综合领域组(BRIDG)模型、来自美国国立癌症研究所(NCI)癌症数据标准注册库和知识库的通用数据元素(CDE)以及NCI叙词表。然后,我们使用最短路径算法来预测从CDE到BRIDG模型中的类的映射。生成的图形数据库为分析和质量保证测试提供了一个强大的语义框架。使用图形数据库预测CDE到BRIDG类的映射受到映射的主观性和数据质量问题的限制。

相似文献

6
The BRIDG project: a technical report.BRIDG项目:一份技术报告。
J Am Med Inform Assoc. 2008 Mar-Apr;15(2):130-7. doi: 10.1197/jamia.M2556. Epub 2007 Dec 20.
7
Sharing behavioral data through a grid infrastructure using data standards.通过使用数据标准的网格基础设施共享行为数据。
J Am Med Inform Assoc. 2014 Jul-Aug;21(4):642-9. doi: 10.1136/amiajnl-2013-001763. Epub 2013 Sep 27.

本文引用的文献

8
Semantically linking in silico cancer models.在计算机癌症模型中的语义链接。
Cancer Inform. 2014 Dec 8;13(Suppl 1):133-43. doi: 10.4137/CIN.S13895. eCollection 2014.
9
Fostering responsible data sharing through standards.通过标准促进负责任的数据共享。
N Engl J Med. 2014 Jun 5;370(23):2163-5. doi: 10.1056/NEJMp1401444.
10
Use artificial neural network to align biological ontologies.使用人工神经网络来对齐生物本体。
BMC Genomics. 2008 Sep 16;9 Suppl 2(Suppl 2):S16. doi: 10.1186/1471-2164-9-S2-S16.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验