• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

深度学习预测细菌基因组中的生物合成基因簇。

Deep Learning to Predict the Biosynthetic Gene Clusters in Bacterial Genomes.

机构信息

Department of Biostatistics, Epidemiology and Informatics, University of Pennsylvania, Philadelphia, PA 19104, USA.

Department of Biostatistics, Epidemiology and Informatics, University of Pennsylvania, Philadelphia, PA 19104, USA.

出版信息

J Mol Biol. 2022 Aug 15;434(15):167597. doi: 10.1016/j.jmb.2022.167597. Epub 2022 May 6.

DOI:10.1016/j.jmb.2022.167597
PMID:35526560
Abstract

Biosynthetic gene clusters (BGCs) in bacterial genomes code for important small molecules and secondary metabolites. Based on the validated BGCs and the corresponding sequences of protein family domains (Pfams), Pfam functions and clan information, we develop a deep learning method e-DeepBGC, that extends DeepBGC, for detecting the BGCs and their biosynthetic class in bacterial genomes. We show that e-DeepBGC leads to reduced false positive rates in BGC identification and an increased sensitivity in identifying BGCs compared to DeepBGC. We apply e-DeepBGC to 5,666 Ref Seq bacterial genomes and detect a total of 170, 685 BGCs with an average of 30.1 BGCs in each genome. We summarize all the predicted BGCs, their functional classes and the distributions of the BGCs in different bacterial phyla.

摘要

细菌基因组中的生物合成基因簇 (BGC) 编码重要的小分子和次生代谢物。基于已验证的 BGC 以及蛋白家族结构域 (Pfam) 的相应序列、 Pfam 功能和族信息,我们开发了一种深度学习方法 e-DeepBGC,对细菌基因组中的 BGC 及其生物合成类别进行检测。我们表明,与 DeepBGC 相比,e-DeepBGC 可以降低 BGC 识别中的假阳性率,并提高识别 BGC 的灵敏度。我们将 e-DeepBGC 应用于 5666 个 Ref Seq 细菌基因组,共检测到 170685 个 BGC,每个基因组平均有 30.1 个 BGC。我们总结了所有预测的 BGC 及其功能类别,以及它们在不同细菌门中的分布情况。

相似文献

1
Deep Learning to Predict the Biosynthetic Gene Clusters in Bacterial Genomes.深度学习预测细菌基因组中的生物合成基因簇。
J Mol Biol. 2022 Aug 15;434(15):167597. doi: 10.1016/j.jmb.2022.167597. Epub 2022 May 6.
2
A deep learning genome-mining strategy for biosynthetic gene cluster prediction.深度学习基因组挖掘策略用于生物合成基因簇预测。
Nucleic Acids Res. 2019 Oct 10;47(18):e110. doi: 10.1093/nar/gkz654.
3
Improving candidate Biosynthetic Gene Clusters in fungi through reinforcement learning.通过强化学习改进真菌中的候选生物合成基因簇。
Bioinformatics. 2022 Aug 10;38(16):3984-3991. doi: 10.1093/bioinformatics/btac420.
4
Identification of the Bacterial Biosynthetic Gene Clusters of the Oral Microbiome Illuminates the Unexplored Social Language of Bacteria during Health and Disease.口腔微生物组的细菌生物合成基因簇的鉴定揭示了健康和疾病期间细菌未被探索的社会语言。
mBio. 2019 Apr 16;10(2):e00321-19. doi: 10.1128/mBio.00321-19.
5
Predicting fungal secondary metabolite activity from biosynthetic gene cluster data using machine learning.基于生物合成基因簇数据利用机器学习预测真菌次生代谢物活性。
Microbiol Spectr. 2024 Feb 6;12(2):e0340023. doi: 10.1128/spectrum.03400-23. Epub 2024 Jan 9.
6
Long-Read Metagenome-Assembled Genomes Improve Identification of Novel Complete Biosynthetic Gene Clusters in a Complex Microbial Activated Sludge Ecosystem.长读长基因组组装提高了复杂微生物活性污泥生态系统中新型完整生物合成基因簇的鉴定。
mSystems. 2022 Dec 20;7(6):e0063222. doi: 10.1128/msystems.00632-22. Epub 2022 Nov 29.
7
Deep self-supervised learning for biosynthetic gene cluster detection and product classification.深度自监督学习在生物合成基因簇检测和产物分类中的应用。
PLoS Comput Biol. 2023 May 23;19(5):e1011162. doi: 10.1371/journal.pcbi.1011162. eCollection 2023 May.
8
An atlas of bacterial secondary metabolite biosynthesis gene clusters.细菌次生代谢物生物合成基因簇图谱。
Environ Microbiol. 2021 Nov;23(11):6981-6992. doi: 10.1111/1462-2920.15761. Epub 2021 Sep 21.
9
Diversity of Bacterial Secondary Metabolite Biosynthetic Gene Clusters in Three Vietnamese Sponges.三种越南海绵中细菌次生代谢产物生物合成基因簇的多样性。
Mar Drugs. 2022 Dec 29;21(1):29. doi: 10.3390/md21010029.
10
Mining metagenomic data to gain a new insight into the gut microbial biosynthetic potential in placental mammals.从宏基因组数据中挖掘新的见解,以了解胎盘哺乳动物肠道微生物的生物合成潜力。
Microbiol Spectr. 2024 Oct 3;12(10):e0086424. doi: 10.1128/spectrum.00864-24. Epub 2024 Aug 20.

引用本文的文献

1
The Deep Mining Era: Genomic, Metabolomic, and Integrative Approaches to Microbial Natural Products from 2018 to 2024.深度挖掘时代:2018年至2024年微生物天然产物的基因组学、代谢组学及综合方法
Mar Drugs. 2025 Jun 23;23(7):261. doi: 10.3390/md23070261.
2
Strategies Used for the Discovery of New Microbial Metabolites with Antibiotic Activity.用于发现具有抗生素活性的新型微生物代谢产物的策略。
Molecules. 2025 Jul 6;30(13):2868. doi: 10.3390/molecules30132868.
3
Bridging Ethnobotanical Knowledge and Multi-Omics Approaches for Plant-Derived Natural Product Discovery.
架起民族植物学知识与多组学方法之间的桥梁以发现植物源天然产物
Metabolites. 2025 May 29;15(6):362. doi: 10.3390/metabo15060362.
4
Draft genome sequences of BIL20 and BIL24, from Philippine fermented fish, feature biosynthetic gene clusters with diverse potential bioactivities.来自菲律宾发酵鱼的BIL20和BIL24的基因组序列草图具有带有多种潜在生物活性的生物合成基因簇。
Microbiol Resour Announc. 2025 Jul 10;14(7):e0007525. doi: 10.1128/mra.00075-25. Epub 2025 Jun 18.
5
Deciphering the biosynthetic potential of microbial genomes using a BGC language processing neural network model.使用生物合成基因簇语言处理神经网络模型解析微生物基因组的生物合成潜力。
Nucleic Acids Res. 2025 Apr 10;53(7). doi: 10.1093/nar/gkaf305.
6
Deep learning in microbiome analysis: a comprehensive review of neural network models.微生物组分析中的深度学习:神经网络模型综述
Front Microbiol. 2025 Jan 22;15:1516667. doi: 10.3389/fmicb.2024.1516667. eCollection 2024.
7
Recent advances in deep learning and language models for studying the microbiome.用于研究微生物组的深度学习和语言模型的最新进展。
Front Genet. 2025 Jan 7;15:1494474. doi: 10.3389/fgene.2024.1494474. eCollection 2024.
8
MIBiG 4.0: advancing biosynthetic gene cluster curation through global collaboration.MIBiG 4.0:通过全球合作推进生物合成基因簇管理
Nucleic Acids Res. 2025 Jan 6;53(D1):D678-D690. doi: 10.1093/nar/gkae1115.
9
Exploring the secrets of marine microorganisms: Unveiling secondary metabolites through metagenomics.探索海洋微生物的奥秘:通过宏基因组学揭示次生代谢产物。
Microb Biotechnol. 2024 Aug;17(8):e14533. doi: 10.1111/1751-7915.14533.
10
Predicting fungal secondary metabolite activity from biosynthetic gene cluster data using machine learning.基于生物合成基因簇数据利用机器学习预测真菌次生代谢物活性。
Microbiol Spectr. 2024 Feb 6;12(2):e0340023. doi: 10.1128/spectrum.03400-23. Epub 2024 Jan 9.