• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用FastOMA进行大规模直系同源推断。

Orthology inference at scale with FastOMA.

作者信息

Majidian Sina, Nevers Yannis, Yazdizadeh Kharrazi Ali, Warwick Vesztrocy Alex, Pascarelli Stefano, Moi David, Glover Natasha, Altenhoff Adrian M, Dessimoz Christophe

机构信息

Department of Computational Biology, University of Lausanne, Lausanne, Switzerland.

Swiss Institute of Bioinformatics, Lausanne, Switzerland.

出版信息

Nat Methods. 2025 Feb;22(2):269-272. doi: 10.1038/s41592-024-02552-8. Epub 2025 Jan 3.

DOI:10.1038/s41592-024-02552-8
PMID:39753922
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11810774/
Abstract

The surge in genome data, with ongoing efforts aiming to sequence 1.5 M eukaryotes in a decade, could revolutionize genomics, revealing the origins, evolution and genetic innovations of biological processes. Yet, traditional genomics methods scale poorly with such large datasets. Here, addressing this, 'FastOMA' provides linear scalability for orthology inference, enabling the processing of thousands of eukaryotic genomes within a day. FastOMA maintains the high accuracy and resolution of the well-established Orthologous Matrix (OMA) approach in benchmarks. FastOMA is available via GitHub at https://github.com/DessimozLab/FastOMA/ .

摘要

基因组数据激增,目前正努力在十年内对150万个真核生物进行测序,这可能会彻底改变基因组学,揭示生物过程的起源、进化和遗传创新。然而,传统的基因组学方法在处理如此庞大的数据集时效果不佳。在此,为解决这一问题,“FastOMA”为直系同源推断提供了线性可扩展性,能够在一天内处理数千个真核生物基因组。在基准测试中,FastOMA保持了成熟的直系同源矩阵(OMA)方法的高精度和分辨率。可通过GitHub上的https://github.com/DessimozLab/FastOMA/获取FastOMA。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5ca8/11810774/d54d0e6682cb/41592_2024_2552_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5ca8/11810774/84826337e0b4/41592_2024_2552_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5ca8/11810774/d54d0e6682cb/41592_2024_2552_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5ca8/11810774/84826337e0b4/41592_2024_2552_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5ca8/11810774/d54d0e6682cb/41592_2024_2552_Fig2_HTML.jpg

相似文献

1
Orthology inference at scale with FastOMA.使用FastOMA进行大规模直系同源推断。
Nat Methods. 2025 Feb;22(2):269-272. doi: 10.1038/s41592-024-02552-8. Epub 2025 Jan 3.
2
Algorithm of OMA for large-scale orthology inference.用于大规模直系同源推断的OMA算法。
BMC Bioinformatics. 2008 Dec 4;9:518. doi: 10.1186/1471-2105-9-518.
3
Orthologous Matrix (OMA) algorithm 2.0: more robust to asymmetric evolutionary rates and more scalable hierarchical orthologous group inference.直系同源矩阵(OMA)算法2.0:对不对称进化速率更具鲁棒性,且在分层直系同源组推断方面更具扩展性。
Bioinformatics. 2017 Jul 15;33(14):i75-i82. doi: 10.1093/bioinformatics/btx229.
4
Identifying orthologs with OMA: A primer.使用OMA鉴定直系同源基因:入门指南。
F1000Res. 2020 Jan 17;9:27. doi: 10.12688/f1000research.21508.1. eCollection 2020.
5
QuartetS-DB: a large-scale orthology database for prokaryotes and eukaryotes inferred by evolutionary evidence.四联体数据库:基于进化证据推断的原核生物和真核生物的大型同源物数据库。
BMC Bioinformatics. 2012 Jun 22;13:143. doi: 10.1186/1471-2105-13-143.
6
Benchmarking orthology methods using phylogenetic patterns defined at the base of Eukaryotes.使用在真核生物基部定义的系统发育模式对同源物方法进行基准测试。
Brief Bioinform. 2021 May 20;22(3). doi: 10.1093/bib/bbaa206.
7
Protein-Coding Gene Families in Prokaryote Genome Comparisons.原核生物基因组比较中的蛋白质编码基因家族。
Methods Mol Biol. 2024;2802:33-55. doi: 10.1007/978-1-0716-3838-5_2.
8
SonicParanoid2: fast, accurate, and comprehensive orthology inference with machine learning and language models.SonicParanoid2:使用机器学习和语言模型实现快速、准确、全面的直系同源推断。
Genome Biol. 2024 Jul 25;25(1):195. doi: 10.1186/s13059-024-03298-4.
9
SwiftOrtho: A fast, memory-efficient, multiple genome orthology classifier.SwiftOrtho:一种快速、内存高效、多基因组同源分类器。
Gigascience. 2019 Oct 1;8(10). doi: 10.1093/gigascience/giz118.
10
OrthoFinder: phylogenetic orthology inference for comparative genomics.OrthoFinder:用于比较基因组学的系统发育直系同源推断。
Genome Biol. 2019 Nov 14;20(1):238. doi: 10.1186/s13059-019-1832-y.

引用本文的文献

1
EvANI benchmarking workflow for evolutionary distance estimation.用于进化距离估计的EvANI基准测试工作流程。
Brief Bioinform. 2025 May 1;26(3). doi: 10.1093/bib/bbaf267.
2
M1CR0B1AL1Z3R 2.0: an enhanced web server for comparative analysis of bacterial genomes at scale.微生物分析器2.0:一个用于大规模细菌基因组比较分析的增强型网络服务器。
Nucleic Acids Res. 2025 Jul 7;53(W1):W369-W375. doi: 10.1093/nar/gkaf413.
3
EvANI benchmarking workflow for evolutionary distance estimation.用于进化距离估计的EvANI基准测试工作流程。

本文引用的文献

1
SonicParanoid2: fast, accurate, and comprehensive orthology inference with machine learning and language models.SonicParanoid2:使用机器学习和语言模型实现快速、准确、全面的直系同源推断。
Genome Biol. 2024 Jul 25;25(1):195. doi: 10.1186/s13059-024-03298-4.
2
Quality assessment of gene repertoire annotations with OMArk.使用OMArk对基因库注释进行质量评估。
Nat Biotechnol. 2025 Jan;43(1):124-133. doi: 10.1038/s41587-024-02147-w. Epub 2024 Feb 21.
3
OMA orthology in 2024: improved prokaryote coverage, ancestral and extant GO enrichment, a revamped synteny viewer and more in the OMA Ecosystem.
bioRxiv. 2025 Feb 23:2025.02.23.639716. doi: 10.1101/2025.02.23.639716.
2024 年的 OMA 同源物:改进的原核生物覆盖范围、祖先和现存 GO 富集、重新设计的同线性视图以及更多的 OMA 生态系统。
Nucleic Acids Res. 2024 Jan 5;52(D1):D513-D521. doi: 10.1093/nar/gkad1020.
4
Integrating gene annotation with orthology inference at scale.大规模整合基因注释与直系同源推断。
Science. 2023 Apr 28;380(6643):eabn3107. doi: 10.1126/science.abn3107.
5
Inference of phylogenetic trees directly from raw sequencing reads using Read2Tree.使用 Read2Tree 从原始测序reads 直接推断系统发育树。
Nat Biotechnol. 2024 Jan;42(1):139-147. doi: 10.1038/s41587-023-01753-4. Epub 2023 Apr 20.
6
TimeTree 5: An Expanded Resource for Species Divergence Times.TimeTree 5:物种分化时间的扩展资源。
Mol Biol Evol. 2022 Aug 6;39(8). doi: 10.1093/molbev/msac174.
7
How to build phylogenetic species trees with OMA.如何使用OMA构建系统发育物种树。
F1000Res. 2020 Jun 4;9:511. doi: 10.12688/f1000research.23790.2. eCollection 2020.
8
The Quest for Orthologs orthology benchmark service in 2022.2022 年的同源基因基准服务探索。
Nucleic Acids Res. 2022 Jul 5;50(W1):W623-W632. doi: 10.1093/nar/gkac330.
9
Ten Years of Collaborative Progress in the Quest for Orthologs.寻找同源基因的十年协同进展。
Mol Biol Evol. 2021 Jul 29;38(8):3033-3045. doi: 10.1093/molbev/msab098.
10
OMAmer: tree-driven and alignment-free protein assignment to subfamilies outperforms closest sequence approaches.OMAmer:基于树的、无需比对的蛋白质亚家族分配方法优于最接近序列的方法。
Bioinformatics. 2021 Sep 29;37(18):2866-2873. doi: 10.1093/bioinformatics/btab219.