• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用 DATS 进行数据发现:典型采用案例和经验教训。

Data discovery with DATS: exemplar adoptions and lessons learned.

机构信息

Oxford e-Research Centre, Engineering Science, University of Oxford, Oxford, UK.

Northrop Grumman Information Systems Health IT, Rockville, MD, USA.

出版信息

J Am Med Inform Assoc. 2018 Jan 1;25(1):13-16. doi: 10.1093/jamia/ocx119.

DOI:10.1093/jamia/ocx119
PMID:29228196
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6481379/
Abstract

The DAta Tag Suite (DATS) is a model supporting dataset description, indexing, and discovery. It is available as an annotated serialization with schema.org, a vocabulary used by major search engines, thus making the datasets discoverable on the web. DATS underlies DataMed, the National Institutes of Health Big Data to Knowledge Data Discovery Index prototype, which aims to provide a "PubMed for datasets." The experience gained while indexing a heterogeneous range of >60 repositories in DataMed helped in evaluating DATS's entities, attributes, and scope. In this work, 3 additional exemplary and diverse data sources were mapped to DATS by their representatives or experts, offering a deep scan of DATS fitness against a new set of existing data. The procedure, including feedback from users and implementers, resulted in DATS implementation guidelines and best practices, and identification of a path for evolving and optimizing the model. Finally, the work exposed additional needs when defining datasets for indexing, especially in the context of clinical and observational information.

摘要

数据标签套件(DATS)是一种支持数据集描述、索引和发现的模型。它以标注的序列化形式与 schema.org 一起提供,schema.org 是主要搜索引擎使用的词汇表,从而使数据集可以在网络上被发现。DATS 是 NIH 大数据转化知识数据发现索引原型 DataMed 的基础,旨在为“数据集的 PubMed”提供支持。在对 DataMed 中异构的超过 60 个存储库进行索引的过程中获得的经验,有助于评估 DATS 的实体、属性和范围。在这项工作中,代表或专家将另外 3 个具有代表性的不同数据源映射到 DATS 上,从而对 DATS 对现有数据集的适用性进行了深入扫描。这一过程包括用户和实施者的反馈,最终制定了 DATS 实施指南和最佳实践,并确定了模型演进和优化的途径。最后,这项工作在为索引定义数据集时暴露了额外的需求,特别是在临床和观察信息的背景下。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e6a2/6481379/5104d486d108/ocx119f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e6a2/6481379/5104d486d108/ocx119f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e6a2/6481379/5104d486d108/ocx119f1.jpg

相似文献

1
Data discovery with DATS: exemplar adoptions and lessons learned.利用 DATS 进行数据发现:典型采用案例和经验教训。
J Am Med Inform Assoc. 2018 Jan 1;25(1):13-16. doi: 10.1093/jamia/ocx119.
2
DATS, the data tag suite to enable discoverability of datasets.DATS,用于实现数据集可发现性的数据标签套件。
Sci Data. 2017 Jun 6;4:170059. doi: 10.1038/sdata.2017.59.
3
DataMed - an open source discovery index for finding biomedical datasets.DataMed——一个用于查找生物医学数据集的开源发现索引。
J Am Med Inform Assoc. 2018 Mar 1;25(3):300-308. doi: 10.1093/jamia/ocx121.
4
Evidence-based Medicine Search: a customizable federated search engine.循证医学搜索:一个可定制的联合搜索引擎。
J Med Libr Assoc. 2008 Apr;96(2):108-13. doi: 10.3163/1536-5050.96.2.108.
5
User needs analysis and usability assessment of DataMed - a biomedical data discovery index.生物医学数据发现索引DataMed的用户需求分析与可用性评估
J Am Med Inform Assoc. 2018 Mar 1;25(3):337-344. doi: 10.1093/jamia/ocx134.
6
Correlation Aware Relevance-Based Semantic Index for Clinical Big Data Repository.基于相关性感知的临床大数据知识库语义索引
J Imaging Inform Med. 2024 Oct;37(5):2597-2611. doi: 10.1007/s10278-024-01095-w. Epub 2024 Apr 23.
7
A model for enhancing Internet medical document retrieval with "medical core metadata".一种利用“医学核心元数据”增强互联网医学文献检索的模型。
J Am Med Inform Assoc. 1999 Mar-Apr;6(2):163-72. doi: 10.1136/jamia.1999.0060163.
8
ImmuneData: an integrated data discovery system for immunology data repositories.ImmuneData:一个用于免疫学数据存储库的数据发现系统。
Database (Oxford). 2022 Mar 9;2022. doi: 10.1093/database/baac003.
9
Natural Language Search Interfaces: Health Data Needs Single-Field Variable Search.自然语言搜索界面:健康数据需要单字段变量搜索。
J Med Internet Res. 2016 Jan 14;18(1):e13. doi: 10.2196/jmir.4912.
10
Ontology-driven indexing of public datasets for translational bioinformatics.用于转化生物信息学的公共数据集的本体驱动索引编制
BMC Bioinformatics. 2009 Feb 5;10 Suppl 2(Suppl 2):S1. doi: 10.1186/1471-2105-10-S2-S1.

引用本文的文献

1
Understanding the Nature of Metadata: Systematic Review.理解元数据的本质:系统评价。
J Med Internet Res. 2022 Jan 11;24(1):e25440. doi: 10.2196/25440.
2
The iTHRIV Commons: a cross-institution information and health research data sharing architecture and web application.iTHRIV Commons:一个跨机构的信息和健康研究数据共享架构和网络应用程序。
J Am Med Inform Assoc. 2022 Mar 15;29(4):631-642. doi: 10.1093/jamia/ocab262.
3
A data citation roadmap for scholarly data repositories.学术数据存储库的数据引用路线图。

本文引用的文献

1
A data citation roadmap for scholarly data repositories.学术数据存储库的数据引用路线图。
Sci Data. 2019 Apr 10;6(1):28. doi: 10.1038/s41597-019-0031-8.
2
DATS, the data tag suite to enable discoverability of datasets.DATS,用于实现数据集可发现性的数据标签套件。
Sci Data. 2017 Jun 6;4:170059. doi: 10.1038/sdata.2017.59.
3
Finding useful data across multiple biomedical data repositories using DataMed.利用 DataMed 在多个生物医学数据存储库中查找有用数据。
Sci Data. 2019 Apr 10;6(1):28. doi: 10.1038/s41597-019-0031-8.
4
Biomedical informatics and data science: evolving fields with significant overlap.生物医学信息学与数据科学:两个重叠度颇高的不断发展的领域。
J Am Med Inform Assoc. 2018 Jan 1;25(1):2-3. doi: 10.1093/jamia/ocx146.
Nat Genet. 2017 May 26;49(6):816-819. doi: 10.1038/ng.3864.
4
MIMIC-III, a freely accessible critical care database.MIMIC-III,一个免费获取的重症监护数据库。
Sci Data. 2016 May 24;3:160035. doi: 10.1038/sdata.2016.35.
5
The Ontology for Biomedical Investigations.生物医学研究本体论
PLoS One. 2016 Apr 29;11(4):e0154556. doi: 10.1371/journal.pone.0154556. eCollection 2016.
6
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
7
Observational Health Data Sciences and Informatics (OHDSI): Opportunities for Observational Researchers.观察性健康数据科学与信息学(OHDSI):观察性研究人员的机遇。
Stud Health Technol Inform. 2015;216:574-8.
8
ImmPort: disseminating data to the public for the future of immunology.免疫数据库(ImmPort):为免疫学的未来向公众传播数据。
Immunol Res. 2014 May;58(2-3):234-9. doi: 10.1007/s12026-014-8516-1.
9
Toward interoperable bioscience data.迈向可互操作的生物科学数据
Nat Genet. 2012 Jan 27;44(2):121-6. doi: 10.1038/ng.1054.