• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

FANTASIA利用语言模型来解码整个动物生命树中的功能性暗蛋白质组。

FANTASIA leverages language models to decode the functional dark proteome across the animal tree of life.

作者信息

Martínez-Redondo Gemma I, Perez-Canales Francisco M, Carbonetto Belén, Fernández José M, Barrios-Núñez Israel, Vázquez-Valls Marçal, Cases Ildefonso, Rojas Ana M, Fernández Rosa

机构信息

Metazoa Phylogenomics and Genome Evolution Lab, Institute of Evolutionary Biology (CSIC-UPF), Barcelona, Spain.

Universitat de Barcelona, Barcelona, Spain.

出版信息

Commun Biol. 2025 Aug 14;8(1):1227. doi: 10.1038/s42003-025-08651-2.

DOI:10.1038/s42003-025-08651-2
PMID:40813894
Abstract

Protein functional annotation is crucial in biology, but many protein-coding genes remain uncharacterized, especially in non-model organisms. FANTASIA (Functional ANnoTAtion based on embedding space SImilArity) integrates protein language models for large-scale functional annotation. Applied to ~1000 animal proteomes, FANTASIA predicts functions to virtually all proteins, including up to 50% that remained unannotated by traditional homology-based methods. This enables the discovery of novel gene functions, enhancing our understanding of molecular evolution and organismal biology. FANTASIA holds particular promise for functional discovery in non-model taxa, offering advantages over homology-based tools in sensitivity and generalizability. FANTASIA is available on GitHub at https://github.com/CBBIO/FANTASIA .

摘要

蛋白质功能注释在生物学中至关重要,但许多蛋白质编码基因仍未得到表征,尤其是在非模式生物中。FANTASIA(基于嵌入空间相似性的功能注释)整合蛋白质语言模型以进行大规模功能注释。应用于约1000个动物蛋白质组,FANTASIA可预测几乎所有蛋白质的功能,包括高达50% 未被传统基于同源性的方法注释的蛋白质。这有助于发现新的基因功能,增进我们对分子进化和生物生物学的理解。FANTASIA在非模式分类群的功能发现方面具有特别的前景,在敏感性和通用性方面比基于同源性的工具更具优势。FANTASIA可在GitHub上获取,网址为https://github.com/CBBIO/FANTASIA 。

相似文献

1
FANTASIA leverages language models to decode the functional dark proteome across the animal tree of life.FANTASIA利用语言模型来解码整个动物生命树中的功能性暗蛋白质组。
Commun Biol. 2025 Aug 14;8(1):1227. doi: 10.1038/s42003-025-08651-2.
2
Functional Annotation of Proteomes Using Protein Language Models: A High-Throughput Implementation of the ProtTrans Model.使用蛋白质语言模型对蛋白质组进行功能注释:ProtTrans模型的高通量实现
Methods Mol Biol. 2025;2941:127-137. doi: 10.1007/978-1-0716-4623-6_8.
3
SAKit: An all-in-one analysis pipeline for identifying novel proteins resulting from variant events at both large and small scales.SAKit:一种用于鉴定由大尺度和小尺度变异事件产生的新型蛋白质的一体化分析管道。
J Bioinform Comput Biol. 2024 Oct;22(5):2450022. doi: 10.1142/S0219720024500227. Epub 2024 Oct 1.
4
Functional (re)annotation of proteome using integrative sequence and AI-based structural approaches.使用整合序列和基于人工智能的结构方法对蛋白质组进行功能(重新)注释。
Curr Res Struct Biol. 2025 Aug 6;10:100172. doi: 10.1016/j.crstbi.2025.100172. eCollection 2025 Dec.
5
MixingDTA: improved drug-target affinity prediction by extending mixup with guilt-by-association.MixingDTA:通过关联负罪感扩展混合增强来改进药物-靶点亲和力预测
Bioinformatics. 2025 Jul 1;41(Supplement_1):i105-i114. doi: 10.1093/bioinformatics/btaf238.
6
Advancing edge-based clustering and graph embedding for biological network analysis: a case study in RASopathies.用于生物网络分析的基于前沿的聚类和图嵌入:以RASopathies为例的研究
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf320.
7
High-Performance Genome Annotation for a Safer and Faster-Developing Phage Therapy.用于更安全、发展更快的噬菌体疗法的高性能基因组注释。
Viruses. 2025 Feb 25;17(3):314. doi: 10.3390/v17030314.
8
pLMMoRF: A Web Server That Accurately Predicts Membrane-interacting Molecular Recognition Features by Employing a Protein Language Model.pLMMoRF:一个通过使用蛋白质语言模型准确预测膜相互作用分子识别特征的网络服务器。
J Mol Biol. 2025 Sep 1;437(17):169236. doi: 10.1016/j.jmb.2025.169236. Epub 2025 May 27.
9
JESTR: Joint Embedding Space Technique for Ranking candidate molecules for the annotation of untargeted metabolomics data.JESTR:用于对非靶向代谢组学数据注释的候选分子进行排名的联合嵌入空间技术。
Bioinformatics. 2025 Jul 1;41(7). doi: 10.1093/bioinformatics/btaf354.
10
Evaluating large language models for annotating proteins.评估大型语言模型在蛋白质注释中的应用。
Brief Bioinform. 2024 Mar 27;25(3). doi: 10.1093/bib/bbae177.

本文引用的文献

1
Bilingual language model for protein sequence and structure.用于蛋白质序列和结构的双语语言模型。
NAR Genom Bioinform. 2024 Nov 15;6(4):lqae150. doi: 10.1093/nargab/lqae150. eCollection 2024 Dec.
2
MATEdb2, a Collection of High-Quality Metazoan Proteomes across the Animal Tree of Life to Speed Up Phylogenomic Studies.MATEdb2,一个高质量后生动物蛋白质组数据库,涵盖动物生命树,以加速系统基因组学研究。
Genome Biol Evol. 2024 Nov 1;16(11). doi: 10.1093/gbe/evae235.
3
The European Reference Genome Atlas: piloting a decentralised approach to equitable biodiversity genomics.
欧洲参考基因组图谱:试行一种分散式的公平生物多样性基因组学方法。
NPJ Biodivers. 2024 Sep 17;3(1):28. doi: 10.1038/s44185-024-00054-6.
4
Decoding functional proteome information in model organisms using protein language models.使用蛋白质语言模型解码模式生物中的功能蛋白质组信息。
NAR Genom Bioinform. 2024 Jul 2;6(3):lqae078. doi: 10.1093/nargab/lqae078. eCollection 2024 Sep.
5
RCSB protein Data Bank: exploring protein 3D similarities via comprehensive structural alignments.RCSB 蛋白质数据库:通过全面的结构比对探索蛋白质 3D 相似性。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae370.
6
Biodiversity: an atlas of European reference genomes.生物多样性:欧洲参考基因组图谱
Nature. 2023 Jul;619(7969):252. doi: 10.1038/d41586-023-02229-w.
7
Evolutionary-scale prediction of atomic-level protein structure with a language model.用语言模型进行原子级蛋白质结构的进化尺度预测。
Science. 2023 Mar 17;379(6637):1123-1130. doi: 10.1126/science.ade2574. Epub 2023 Mar 16.
8
simplifyEnrichment: A Bioconductor Package for Clustering and Visualizing Functional Enrichment Results.simplifyEnrichment:一个用于聚类和可视化功能富集结果的 Bioconductor 包。
Genomics Proteomics Bioinformatics. 2023 Feb;21(1):190-202. doi: 10.1016/j.gpb.2022.04.008. Epub 2022 Jun 6.
9
ColabFold: making protein folding accessible to all.ColabFold:让蛋白质折叠变得人人可用。
Nat Methods. 2022 Jun;19(6):679-682. doi: 10.1038/s41592-022-01488-1. Epub 2022 May 30.
10
ToxinPred2: an improved method for predicting toxicity of proteins.ToxinPred2:一种改进的蛋白质毒性预测方法。
Brief Bioinform. 2022 Sep 20;23(5). doi: 10.1093/bib/bbac174.