• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

拓展与混编元数据领域。

Expanding and Remixing the Metadata Landscape.

机构信息

Department of Systems Pharmacology and Translational Therapeutics, Perelman School of Medicine, University of Pennsylvania, Philadelphia, PA, USA.

Department of Systems Pharmacology and Translational Therapeutics, Perelman School of Medicine, University of Pennsylvania, Philadelphia, PA, USA; Childhood Cancer Data Lab, Alex's Lemonade Stand Foundation, Philadelphia, PA, USA.

出版信息

Trends Cancer. 2021 Apr;7(4):276-278. doi: 10.1016/j.trecan.2020.10.011. Epub 2020 Nov 20.

DOI:10.1016/j.trecan.2020.10.011
PMID:33229213
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8324015/
Abstract

Genomic data sharing accelerates research. Data are most valuable when they are accompanied by detailed metadata. To date, metadata are often human-annotated descriptions of samples and their handling. We discuss how machine learning-derived elements complement such descriptions to enhance the research ecosystem around genomic data.

摘要

基因组数据共享加速了研究进程。当数据伴随着详细的元数据时,它们最具价值。迄今为止,元数据通常是对样本及其处理的人工注释描述。我们讨论了机器学习衍生元素如何补充这些描述,以增强基因组数据研究生态系统。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ead/8324015/6de2fe968c55/nihms-1724518-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ead/8324015/6de2fe968c55/nihms-1724518-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0ead/8324015/6de2fe968c55/nihms-1724518-f0001.jpg

相似文献

1
Expanding and Remixing the Metadata Landscape.拓展与混编元数据领域。
Trends Cancer. 2021 Apr;7(4):276-278. doi: 10.1016/j.trecan.2020.10.011. Epub 2020 Nov 20.
2
Systematic tissue annotations of genomics samples by modeling unstructured metadata.通过对非结构化元数据进行建模来对基因组学样本进行系统的组织注释。
Nat Commun. 2022 Nov 8;13(1):6736. doi: 10.1038/s41467-022-34435-x.
3
GeMI: interactive interface for transformer-based Genomic Metadata Integration.GeMI:基于转换器的基因组元数据集成的交互式接口。
Database (Oxford). 2022 Jun 3;2022. doi: 10.1093/database/baac036.
4
FAIR Genomes metadata schema promoting Next Generation Sequencing data reuse in Dutch healthcare and research.FAIR 基因组元数据模式促进荷兰医疗保健和研究领域的下一代测序数据再利用。
Sci Data. 2022 Apr 13;9(1):169. doi: 10.1038/s41597-022-01265-x.
5
Recommendations for the FAIRification of genomic track metadata.基因组轨迹元数据的 FAIR 化推荐。
F1000Res. 2021 Apr 1;10. doi: 10.12688/f1000research.28449.1. eCollection 2021.
6
A streamlined workflow for conversion, peer review, and publication of genomics metadata as omics data papers.一种用于将基因组学元数据转换、同行评审和发表为组学数据论文的简化工作流程。
Gigascience. 2021 May 13;10(5). doi: 10.1093/gigascience/giab034.
7
On the importance of metadata when sharing and opening data.论分享和开放数据时元数据的重要性。
BMC Genom Data. 2022 Nov 12;23(1):79. doi: 10.1186/s12863-022-01095-1.
8
Meta-learning reduces the amount of data needed to build AI models in oncology.元学习减少了肿瘤学中构建人工智能模型所需的数据量。
Br J Cancer. 2021 Aug;125(3):309-310. doi: 10.1038/s41416-021-01358-1. Epub 2021 Mar 29.
9
"METAGENOTE: a simplified web platform for metadata annotation of genomic samples and streamlined submission to NCBI's sequence read archive".METAGENOTE:一个简化的基因组样本元数据注释的网络平台,简化了向 NCBI 的序列读取档案提交的流程。
BMC Bioinformatics. 2020 Sep 3;21(1):378. doi: 10.1186/s12859-020-03694-0.
10
Metadata Repository for Improved Data Sharing and Reuse Based on HL7 FHIR.基于HL7 FHIR的用于改进数据共享和重用的元数据存储库。
Stud Health Technol Inform. 2016;228:162-6.

引用本文的文献

1
aurora: a machine learning gwas tool for analyzing microbial habitat adaptation.奥罗拉:一种用于分析微生物栖息地适应性的机器学习全基因组关联研究工具。
Genome Biol. 2025 Mar 23;26(1):66. doi: 10.1186/s13059-025-03524-7.
2
Gene signatures for cancer research: A 25-year retrospective and future avenues.癌症研究的基因特征: 25 年的回顾与未来方向。
PLoS Comput Biol. 2024 Oct 16;20(10):e1012512. doi: 10.1371/journal.pcbi.1012512. eCollection 2024 Oct.
3
The evolution of computational research in a data-centric world.数据中心世界中计算研究的演进。

本文引用的文献

1
Responsible, practical genomic data sharing that accelerates research.负责任、实用的基因组数据共享,加速研究。
Nat Rev Genet. 2020 Oct;21(10):615-629. doi: 10.1038/s41576-020-0257-5. Epub 2020 Jul 21.
2
The Impact of Stroma Admixture on Molecular Subtypes and Prognostic Gene Signatures in Serous Ovarian Cancer.基质混合对浆液性卵巢癌分子亚型和预后基因特征的影响。
Cancer Epidemiol Biomarkers Prev. 2020 Feb;29(2):509-519. doi: 10.1158/1055-9965.EPI-18-1359. Epub 2019 Dec 23.
3
Ovarian cancer and the evolution of subtype classifications using transcriptional profiling†.
Cell. 2024 Aug 22;187(17):4449-4457. doi: 10.1016/j.cell.2024.07.045.
4
Metadata retrieval from sequence databases with ffq.利用 ffq 从序列数据库中检索元数据。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac667.
5
A systematic review of datasets that can help elucidate relationships among gene expression, race, and immunohistochemistry-defined subtypes in breast cancer.一项系统综述了有助于阐明乳腺癌中基因表达、种族和免疫组织化学定义的亚型之间关系的数据集。
Cancer Biol Ther. 2021 Sep 2;22(7-9):417-429. doi: 10.1080/15384047.2021.1953902. Epub 2021 Aug 19.
6
Kmerator Suite: design of specific -mer signatures and automatic metadata discovery in large RNA-seq datasets.Kmerator套件:在大型RNA测序数据集中设计特定的k-mer特征并自动发现元数据
NAR Genom Bioinform. 2021 Jun 23;3(3):lqab058. doi: 10.1093/nargab/lqab058. eCollection 2021 Sep.
7
Improving the completeness of public metadata accompanying omics studies.提高组学研究中公共元数据的完整性。
Genome Biol. 2021 Apr 15;22(1):106. doi: 10.1186/s13059-021-02332-z.
卵巢癌和基于转录组特征的亚型分类演变。
Biol Reprod. 2019 Sep 1;101(3):645-658. doi: 10.1093/biolre/ioz099.
4
MultiPLIER: A Transfer Learning Framework for Transcriptomics Reveals Systemic Features of Rare Disease.MultiPLIER:一种转录组学的迁移学习框架,揭示了罕见病的系统特征。
Cell Syst. 2019 May 22;8(5):380-394.e4. doi: 10.1016/j.cels.2019.04.003.
5
Methylation-Based Biological Age and Breast Cancer Risk.基于甲基化的生物年龄与乳腺癌风险。
J Natl Cancer Inst. 2019 Oct 1;111(10):1051-1058. doi: 10.1093/jnci/djz020.
6
The variable quality of metadata about biological samples used in biomedical experiments.生物医学实验中使用的生物样本元数据的质量参差不齐。
Sci Data. 2019 Feb 19;6:190021. doi: 10.1038/sdata.2019.21.
7
The Immune Landscape of Cancer.癌症的免疫全景。
Immunity. 2018 Apr 17;48(4):812-830.e14. doi: 10.1016/j.immuni.2018.03.023. Epub 2018 Apr 5.
8
Improving the value of public RNA-seq expression data by phenotype prediction.通过表型预测提高公共 RNA-seq 表达数据的价值。
Nucleic Acids Res. 2018 May 18;46(9):e54. doi: 10.1093/nar/gky102.
9
Computational deconvolution of transcriptomics data from mixed cell populations.计算从混合细胞群体中转录组数据的去卷积。
Bioinformatics. 2018 Jun 1;34(11):1969-1979. doi: 10.1093/bioinformatics/bty019.
10
MetaSRA: normalized human sample-specific metadata for the Sequence Read Archive.MetaSRA:序列读取档案中标准化的人类样本特定元数据。
Bioinformatics. 2017 Sep 15;33(18):2914-2923. doi: 10.1093/bioinformatics/btx334.