用于机器学习分析的多组学数据整合策略。

Integration strategies of multi-omics data for machine learning analysis.

作者信息

Picard Milan, Scott-Boyer Marie-Pier, Bodein Antoine, Périn Olivier, Droit Arnaud

机构信息

Molecular Medicine Department, CHU de Québec Research Center, Université Laval, Québec, QC, Canada.

Digital Sciences Department, L'Oréal Advanced Research, Aulnay-sous-bois, France.

出版信息

Comput Struct Biotechnol J. 2021 Jun 22;19:3735-3746. doi: 10.1016/j.csbj.2021.06.030. eCollection 2021.

DOI:10.1016/j.csbj.2021.06.030

PMID:34285775

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8258788/

Abstract

Increased availability of high-throughput technologies has generated an ever-growing number of omics data that seek to portray many different but complementary biological layers including genomics, epigenomics, transcriptomics, proteomics, and metabolomics. New insight from these data have been obtained by machine learning algorithms that have produced diagnostic and classification biomarkers. Most biomarkers obtained to date however only include one omic measurement at a time and thus do not take full advantage of recent multi-omics experiments that now capture the entire complexity of biological systems. Multi-omics data integration strategies are needed to combine the complementary knowledge brought by each omics layer. We have summarized the most recent data integration methods/ frameworks into five different integration strategies: early, mixed, intermediate, late and hierarchical. In this mini-review, we focus on challenges and existing multi-omics integration strategies by paying special attention to machine learning applications.

摘要

高通量技术可用性的提高产生了越来越多的组学数据，这些数据试图描绘许多不同但互补的生物层面，包括基因组学、表观基因组学、转录组学、蛋白质组学和代谢组学。通过机器学习算法已经从这些数据中获得了新的见解，这些算法产生了诊断和分类生物标志物。然而，迄今为止获得的大多数生物标志物一次仅包含一种组学测量，因此没有充分利用现在能够捕捉生物系统全部复杂性的最新多组学实验。需要多组学数据整合策略来结合每个组学层面带来的互补知识。我们已将最新的数据整合方法/框架总结为五种不同的整合策略：早期、混合、中期、晚期和分层。在本综述中，我们特别关注机器学习应用，重点探讨挑战和现有的多组学整合策略。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3412/8258788/9a9fb93b2280/ga1.jpg

相似文献

Integration strategies of multi-omics data for machine learning analysis.

Comput Struct Biotechnol J. 2021 Jun 22;19:3735-3746. doi: 10.1016/j.csbj.2021.06.030. eCollection 2021.

A Customizable Analysis Flow in Integrative Multi-Omics.

Biomolecules. 2020 Nov 27;10(12):1606. doi: 10.3390/biom10121606.

Statistical and Machine-Learning Analyses in Nutritional Genomics Studies.

Nutrients. 2020 Oct 14;12(10):3140. doi: 10.3390/nu12103140.

Multi-modal intermediate integrative methods in neuropsychiatric disorders: A review.

Comput Struct Biotechnol J. 2022 Nov 8;20:6149-6162. doi: 10.1016/j.csbj.2022.11.008. eCollection 2022.

A comprehensive review of machine learning techniques for multi-omics data integration: challenges and applications in precision oncology.

Brief Funct Genomics. 2024 Sep 27;23(5):549-560. doi: 10.1093/bfgp/elae013.

Applications of multi-omics analysis in human diseases.

MedComm (2020). 2023 Jul 31;4(4):e315. doi: 10.1002/mco2.315. eCollection 2023 Aug.

MOSDNET: A multi-omics classification framework using simplified multi-view deep discriminant representation learning and dynamic edge GCN with multi-task learning.

Comput Biol Med. 2024 Oct;181:109040. doi: 10.1016/j.compbiomed.2024.109040. Epub 2024 Aug 20.

Multi-omics integration in biomedical research - A metabolomics-centric review.

Anal Chim Acta. 2021 Jan 2;1141:144-162. doi: 10.1016/j.aca.2020.10.038. Epub 2020 Oct 22.

Deep learning-based approaches for multi-omics data integration and analysis.

BioData Min. 2024 Oct 2;17(1):38. doi: 10.1186/s13040-024-00391-z.

Machine learning: its challenges and opportunities in plant system biology.

Appl Microbiol Biotechnol. 2022 May;106(9-10):3507-3530. doi: 10.1007/s00253-022-11963-6. Epub 2022 May 16.

引用本文的文献

Editorial: Multi-scale systems: ecological approaches to investigate the role of the microbiota in different niches.

Front Mol Biosci. 2025 Aug 8;12:1665390. doi: 10.3389/fmolb.2025.1665390. eCollection 2025.

fuseMLR: an R package for integrative prediction modeling of multi-omics data.

BMC Bioinformatics. 2025 Aug 26;26(1):221. doi: 10.1186/s12859-025-06248-4.

A technical review of multi-omics data integration methods: from classical statistical to deep generative approaches.

Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf355.

Elucidating the interplay between metabolites and microorganisms in the spermosphere of common bean ( L.) seeds.

mSystems. 2025 Aug 19;10(8):e0070725. doi: 10.1128/msystems.00707-25. Epub 2025 Jul 31.

Unraveling bioactive potential and production in through omics and machine learning modeling.

Chin Herb Med. 2025 May 19;17(3):414-427. doi: 10.1016/j.chmed.2025.05.003. eCollection 2025 Jul.

Interpretable graph Kolmogorov-Arnold networks for multi-cancer classification and biomarker identification using multi-omics data.

Sci Rep. 2025 Jul 29;15(1):27607. doi: 10.1038/s41598-025-13337-0.

Decoding sex differences in human immunity through systems immunology.

Oxf Open Immunol. 2025 Jul 4;6(1):iqaf006. doi: 10.1093/oxfimm/iqaf006. eCollection 2025.

Wheels turning: CHO cell modeling moves into a digital biomanufacturing era: Subtitle: CHO Metabolic Modeling.

Comput Struct Biotechnol J. 2025 Jun 23;27:2796-2813. doi: 10.1016/j.csbj.2025.06.035. eCollection 2025.

Research advances in intramuscular fat deposition and chicken meat quality: genetics and nutrition.

J Anim Sci Biotechnol. 2025 Jul 16;16(1):100. doi: 10.1186/s40104-025-01234-5.

Multi-omics decodes host-specific and environmental microbiome interactions in sepsis.

Front Microbiol. 2025 Jun 26;16:1618177. doi: 10.3389/fmicb.2025.1618177. eCollection 2025.

本文引用的文献

Interpretation of deep learning in genomics and epigenomics.

Brief Bioinform. 2021 May 20;22(3). doi: 10.1093/bib/bbaa177.

Performance Comparison of Deep Learning Autoencoders for Cancer Subtype Detection Using Multi-Omics Data.

Cancers (Basel). 2021 Apr 22;13(9):2013. doi: 10.3390/cancers13092013.

DNA methylation and gene expression integration in cardiovascular disease.

Clin Epigenetics. 2021 Apr 9;13(1):75. doi: 10.1186/s13148-021-01064-y.

An integrative multi-omics approach reveals new central nervous system pathway alterations in Alzheimer's disease.

Alzheimers Res Ther. 2021 Apr 1;13(1):71. doi: 10.1186/s13195-021-00814-7.

Multi-omics analysis of genomics, epigenomics and transcriptomics for molecular subtypes and core genes for lung adenocarcinoma.

BMC Cancer. 2021 Mar 9;21(1):257. doi: 10.1186/s12885-021-07888-4.

Multi-dimensional data integration algorithm based on random walk with restart.

BMC Bioinformatics. 2021 Feb 27;22(1):97. doi: 10.1186/s12859-021-04029-3.

Integrative analysis of genomic, epigenomic and transcriptomic data identified molecular subtypes of esophageal carcinoma.

Aging (Albany NY). 2021 Feb 26;13(5):6999-7019. doi: 10.18632/aging.202556.

Multi-omics approaches in cancer research with applications in tumor subtyping, prognosis, and diagnosis.

Comput Struct Biotechnol J. 2021 Jan 22;19:949-960. doi: 10.1016/j.csbj.2021.01.009. eCollection 2021.

Subtype-GAN: a deep learning approach for integrative cancer subtyping of multi-omics data.

Bioinformatics. 2021 Aug 25;37(16):2231-2237. doi: 10.1093/bioinformatics/btab109.

Multi-layered network-based pathway activity inference using directed random walks: application to predicting clinical outcomes in urologic cancer.

Bioinformatics. 2021 Aug 25;37(16):2405-2413. doi: 10.1093/bioinformatics/btab086.

文献AI研究员

20分钟写一篇综述，助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型，支持多种主流文档格式。

立即体验

用于机器学习分析的多组学数据整合策略。

Integration strategies of multi-omics data for machine learning analysis.

作者信息

Picard Milan, Scott-Boyer Marie-Pier, Bodein Antoine, Périn Olivier, Droit Arnaud

机构信息

Molecular Medicine Department, CHU de Québec Research Center, Université Laval, Québec, QC, Canada.

Digital Sciences Department, L'Oréal Advanced Research, Aulnay-sous-bois, France.

出版信息

Comput Struct Biotechnol J. 2021 Jun 22;19:3735-3746. doi: 10.1016/j.csbj.2021.06.030. eCollection 2021.

DOI:10.1016/j.csbj.2021.06.030

PMID:34285775

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8258788/

Abstract

摘要

用于机器学习分析的多组学数据整合策略。

Integration strategies of multi-omics data for machine learning analysis.

作者信息

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献AI研究员

用中文搜PubMed

文档翻译

Suppr 超能文献

用于机器学习分析的多组学数据整合策略。

Integration strategies of multi-omics data for machine learning analysis.

作者信息

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献