• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于宏基因组学研究的前沿深度学习工具。

Cutting-edge deep-learning based tools for metagenomic research.

作者信息

Levy Karin Eli, Steinegger Martin

机构信息

ELKMO, Copenhagen 2720, Denmark.

School of Biological Sciences, Seoul National University, Seoul 08826, Republic of Korea.

出版信息

Natl Sci Rev. 2025 Feb 19;12(6):nwaf056. doi: 10.1093/nsr/nwaf056. eCollection 2025 Jun.

DOI:10.1093/nsr/nwaf056
PMID:40469774
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC12136054/
Abstract

Recent years have seen incredible progress in the development of deep-learning (DL) tools for the analysis of biological data, with the most prominent example being AlphaFold2 for accurate protein structure prediction. DL-based tools are especially useful for identifying patterns and connections within sparsely labeled datasets. This makes them essential for the analysis of metagenomic data, which is mostly unannotated and bears little sequence similarity to known genes and proteins. In this review, we chose to present 12 tools which we deem as offering novel capabilities for metagenomic analysis by utilizing interesting DL techniques. This review is thus intended to be a solid starting point for any data scientist looking to apply advanced methods to explore metagenomic datasets. For each DL-based tool, we present its computational principles, followed by relevant examples of its application where possible and a note on its limitations.

摘要

近年来,用于分析生物数据的深度学习(DL)工具取得了惊人的进展,最突出的例子是用于精确蛋白质结构预测的AlphaFold2。基于DL的工具对于识别稀疏标记数据集中的模式和联系特别有用。这使得它们对于宏基因组数据分析至关重要,因为宏基因组数据大多未注释,且与已知基因和蛋白质的序列相似性很小。在本综述中,我们选择介绍12种工具,我们认为这些工具通过利用有趣的DL技术为宏基因组分析提供了新的能力。因此,本综述旨在为任何希望应用先进方法探索宏基因组数据集的数据科学家提供一个坚实的起点。对于每个基于DL的工具,我们介绍其计算原理,随后尽可能给出相关应用示例,并说明其局限性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3de/12136054/bf4839a8a5f7/nwaf056fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3de/12136054/bf4839a8a5f7/nwaf056fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3de/12136054/bf4839a8a5f7/nwaf056fig1.jpg

相似文献

1
Cutting-edge deep-learning based tools for metagenomic research.用于宏基因组学研究的前沿深度学习工具。
Natl Sci Rev. 2025 Feb 19;12(6):nwaf056. doi: 10.1093/nsr/nwaf056. eCollection 2025 Jun.
2
3
geneRFinder: gene finding in distinct metagenomic data complexities.基因 RFinder:在不同元基因组数据复杂性中进行基因预测。
BMC Bioinformatics. 2021 Feb 25;22(1):87. doi: 10.1186/s12859-021-03997-w.
4
COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets.认知器:宏基因组数据集功能注释框架
PLoS One. 2015 Nov 11;10(11):e0142102. doi: 10.1371/journal.pone.0142102. eCollection 2015.
5
MegaD: Deep Learning for Rapid and Accurate Disease Status Prediction of Metagenomic Samples.MegaD:用于宏基因组样本疾病状态快速准确预测的深度学习
Life (Basel). 2022 Apr 30;12(5):669. doi: 10.3390/life12050669.
6
Protein Language Models Uncover Carbohydrate-Active Enzyme Function in Metagenomics.蛋白质语言模型揭示宏基因组学中碳水化合物活性酶的功能。
bioRxiv. 2023 Oct 25:2023.10.23.563620. doi: 10.1101/2023.10.23.563620.
7
A Systematic Review and Identification of the Challenges of Deep Learning Techniques for Undersampled Magnetic Resonance Image Reconstruction.深度学习技术在磁共振图像欠采样重建中面临的挑战的系统评价与识别
Sensors (Basel). 2024 Jan 24;24(3):753. doi: 10.3390/s24030753.
8
Evaluating metagenomics tools for genome binning with real metagenomic datasets and CAMI datasets.评估宏基因组工具在真实宏基因组数据集和 CAMI 数据集上的基因组 binning 效果。
BMC Bioinformatics. 2020 Jul 28;21(1):334. doi: 10.1186/s12859-020-03667-3.
9
Phylogeny-based classification of microbial communities.基于系统发育的微生物群落分类。
Bioinformatics. 2014 Feb 15;30(4):449-56. doi: 10.1093/bioinformatics/btt700. Epub 2013 Dec 24.
10
Comprehensive Functional Annotation of Metagenomes and Microbial Genomes Using a Deep Learning-Based Method.基于深度学习的宏基因组和微生物组综合功能注释。
mSystems. 2023 Apr 27;8(2):e0117822. doi: 10.1128/msystems.01178-22. Epub 2023 Mar 7.

引用本文的文献

1
Deciphering enzymatic potential in metagenomic reads through DNA language models.通过DNA语言模型解读宏基因组读数中的酶促潜力。
Nucleic Acids Res. 2025 Aug 27;53(16). doi: 10.1093/nar/gkaf836.
2
AIM: AI for microbiology.目标:用于微生物学的人工智能。
Natl Sci Rev. 2025 Jun 25;12(6):nwaf225. doi: 10.1093/nsr/nwaf225. eCollection 2025 Jun.

本文引用的文献

1
Soil microbial responses to multiple global change factors as assessed by metagenomics.通过宏基因组学评估土壤微生物对多种全球变化因素的响应。
Nat Commun. 2025 May 31;16(1):5058. doi: 10.1038/s41467-025-60390-4.
2
Rapid and sensitive protein complex alignment with Foldseek-Multimer.使用Foldseek-Multimer进行快速灵敏的蛋白质复合物比对。
Nat Methods. 2025 Mar;22(3):469-472. doi: 10.1038/s41592-025-02593-7. Epub 2025 Feb 5.
3
Bilingual language model for protein sequence and structure.用于蛋白质序列和结构的双语语言模型。
NAR Genom Bioinform. 2024 Nov 15;6(4):lqae150. doi: 10.1093/nargab/lqae150. eCollection 2024 Dec.
4
Easy and accurate protein structure prediction using ColabFold.使用ColabFold进行简单而准确的蛋白质结构预测。
Nat Protoc. 2025 Mar;20(3):620-642. doi: 10.1038/s41596-024-01060-5. Epub 2024 Oct 14.
5
Using artificial intelligence to document the hidden RNA virosphere.利用人工智能记录隐藏的 RNA 病毒圈。
Cell. 2024 Nov 27;187(24):6929-6942.e16. doi: 10.1016/j.cell.2024.09.027. Epub 2024 Oct 9.
6
Taxometer: Improving taxonomic classification of metagenomics contigs.Taxometer:提高宏基因组序列的分类学分类。
Nat Commun. 2024 Sep 27;15(1):8357. doi: 10.1038/s41467-024-52771-y.
7
Enhancing predictions of protein stability changes induced by single mutations using MSA-based Language Models.使用基于多序列比对的语言模型增强对单突变诱导的蛋白质稳定性变化的预测。
Bioinformatics. 2024 Jul 16;40(7). doi: 10.1093/bioinformatics/btae447.
8
Metabuli: sensitive and specific metagenomic classification via joint analysis of amino acid and DNA.Metabuli:通过联合分析氨基酸和 DNA 进行敏感和特异的宏基因组分类。
Nat Methods. 2024 Jun;21(6):971-973. doi: 10.1038/s41592-024-02273-y. Epub 2024 May 20.
9
Accurate structure prediction of biomolecular interactions with AlphaFold 3.利用 AlphaFold 3 进行生物分子相互作用的精确结构预测。
Nature. 2024 Jun;630(8016):493-500. doi: 10.1038/s41586-024-07487-w. Epub 2024 May 8.
10
Deep learning methods in metagenomics: a review.元基因组学中的深度学习方法:综述。
Microb Genom. 2024 Apr;10(4). doi: 10.1099/mgen.0.001231.