• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

InParanoid-DIAMOND:使用 InParanoid 算法进行更快的同源分析。

InParanoid-DIAMOND: faster orthology analysis with the InParanoid algorithm.

机构信息

Department of Biochemistry and Biophysics, Stockholm University, Science for Life Laboratory, 17121 Solna, Sweden.

出版信息

Bioinformatics. 2022 May 13;38(10):2918-2919. doi: 10.1093/bioinformatics/btac194.

DOI:10.1093/bioinformatics/btac194
PMID:35561192
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9113356/
Abstract

SUMMARY

Predicting orthologs, genes in different species having shared ancestry, is an important task in bioinformatics. Orthology prediction tools are required to make accurate and fast predictions, in order to analyze large amounts of data within a feasible time frame. InParanoid is a well-known algorithm for orthology analysis, shown to perform well in benchmarks, but having the major limitation of long runtimes on large datasets. Here, we present an update to the InParanoid algorithm that can use the faster tool DIAMOND instead of BLAST for the homolog search step. We show that it reduces the runtime by 94%, while still obtaining similar performance in the Quest for Orthologs benchmark.

AVAILABILITY AND IMPLEMENTATION

The source code is available at (https://bitbucket.org/sonnhammergroup/inparanoid).

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

预测直系同源物,即不同物种中具有共同祖先的基因,是生物信息学中的一项重要任务。为了在可行的时间内分析大量数据,需要使用准确且快速的直系同源物预测工具。InParanoid 是一种用于直系同源分析的知名算法,在基准测试中表现良好,但存在一个主要限制,即在大型数据集上运行时间长。在这里,我们对 InParanoid 算法进行了更新,使其可以在同源搜索步骤中使用更快的工具 DIAMOND 代替 BLAST。我们表明,它将运行时间缩短了 94%,同时在 Quest for Orthologs 基准测试中仍获得了类似的性能。

可用性和实现

源代码可在 (https://bitbucket.org/sonnhammergroup/inparanoid) 获得。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
InParanoid-DIAMOND: faster orthology analysis with the InParanoid algorithm.InParanoid-DIAMOND:使用 InParanoid 算法进行更快的同源分析。
Bioinformatics. 2022 May 13;38(10):2918-2919. doi: 10.1093/bioinformatics/btac194.
2
Domainoid: domain-oriented orthology inference.域型体:面向域的直系同源推断。
BMC Bioinformatics. 2019 Oct 28;20(1):523. doi: 10.1186/s12859-019-3137-2.
3
Improved orthology inference with Hieranoid 2.使用Hieranoid 2改进直系同源推断。
Bioinformatics. 2017 Apr 15;33(8):1154-1159. doi: 10.1093/bioinformatics/btw774.
4
InParanoiDB 9: Ortholog Groups for Protein Domains and Full-Length Proteins.InParanoiDB 9:蛋白质结构域和全长蛋白质的直系同源组。
J Mol Biol. 2023 Jul 15;435(14):168001. doi: 10.1016/j.jmb.2023.168001. Epub 2023 Feb 9.
5
InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic.InParanoid 8:273个蛋白质组之间的直系同源分析,大部分为真核生物蛋白质组。
Nucleic Acids Res. 2015 Jan;43(Database issue):D234-9. doi: 10.1093/nar/gku1203. Epub 2014 Nov 27.
6
Clustering orthologous proteins across phylogenetically distant species.跨系统发育距离较远的物种对直系同源蛋白进行聚类。
Proteins. 2008 May 15;71(3):1113-22. doi: 10.1002/prot.21792.
7
Berkeley PHOG: PhyloFacts orthology group prediction web server.伯克利PHOG:系统发育事实直系同源组预测网络服务器。
Nucleic Acids Res. 2009 Jul;37(Web Server issue):W84-9. doi: 10.1093/nar/gkp373. Epub 2009 May 12.
8
morFeus: a web-based program to detect remotely conserved orthologs using symmetrical best hits and orthology network scoring.MorFeus:一个基于网络的程序,使用对称最佳匹配和同源网络评分来检测远程保守的直系同源物。
BMC Bioinformatics. 2014 Aug 6;15(1):263. doi: 10.1186/1471-2105-15-263.
9
InParanoid 7: new algorithms and tools for eukaryotic orthology analysis.InParanoid 7:真核生物直系同源分析的新算法和工具。
Nucleic Acids Res. 2010 Jan;38(Database issue):D196-203. doi: 10.1093/nar/gkp931. Epub 2009 Nov 5.
10
Assessing performance of orthology detection strategies applied to eukaryotic genomes.评估应用于真核生物基因组的直系同源检测策略的性能。
PLoS One. 2007 Apr 18;2(4):e383. doi: 10.1371/journal.pone.0000383.

引用本文的文献

1
Uukuniemi virus infection causes a pervasive remodelling of the RNA-binding proteome in tick cells.乌库涅米病毒感染导致蜱细胞中RNA结合蛋白质组的广泛重塑。
PLoS Pathog. 2025 Aug 4;21(8):e1013393. doi: 10.1371/journal.ppat.1013393. eCollection 2025 Aug.
2
Feature Architecture-Aware Ortholog Search With fDOG Reveals the Distribution of Plant Cell Wall-Degrading Enzymes Across Life.基于fDOG的特征架构感知直系同源物搜索揭示了植物细胞壁降解酶在生命中的分布。
Mol Biol Evol. 2025 Jun 4;42(6). doi: 10.1093/molbev/msaf120.
3
SOI: robust identification of orthologous synteny with the Orthology Index and broad applications in evolutionary genomics.SOI:利用直系同源索引对直系同源同线性进行可靠识别及其在进化基因组学中的广泛应用。
Nucleic Acids Res. 2025 Apr 10;53(7). doi: 10.1093/nar/gkaf320.
4
Ethylene response factors as potential regulators of cell wall formation in celery (Apium graveolens L.) collenchyma: phylogeny and gene expression analysis.乙烯反应因子作为芹菜(Apium graveolens L.)厚角组织细胞壁形成的潜在调节因子:系统发育和基因表达分析
Protoplasma. 2025 Feb 10. doi: 10.1007/s00709-025-02042-4.
5
Unearthing the secrets of Australia's most enigmatic and cryptic mammal, the marsupial mole.探寻澳大利亚最神秘、最隐秘的有袋类哺乳动物——袋鼹的秘密。
Sci Adv. 2025 Jan 3;11(1):eado4140. doi: 10.1126/sciadv.ado4140. Epub 2025 Jan 1.
6
DAVID Ortholog: an integrative tool to enhance functional analysis through orthologs.DAVID 直系同源基因:通过直系同源基因增强功能分析的综合工具。
Bioinformatics. 2024 Oct 1;40(10). doi: 10.1093/bioinformatics/btae615.
7
Characterization of the Mitochondrial Proteome in the Ctenophore Mnemiopsis leidyi Using MitoPredictor.使用 MitoPredictor 对中胚层栉水母 Mnemiopsis leidyi 的线粒体蛋白质组进行特征描述。
Methods Mol Biol. 2024;2757:239-257. doi: 10.1007/978-1-0716-3642-8_10.
8
Updates to the Alliance of Genome Resources central infrastructure.联盟基因组资源中心基础设施的更新。
Genetics. 2024 May 7;227(1). doi: 10.1093/genetics/iyae049.
9
RpoS-Regulated Genes and Phenotypes in the Phytopathogenic Bacterium .RpoS 调控的基因与植物病原细菌的表型
Int J Mol Sci. 2023 Dec 11;24(24):17348. doi: 10.3390/ijms242417348.
10
PlantPAN 4.0: updated database for identifying conserved non-coding sequences and exploring dynamic transcriptional regulation in plant promoters.PlantPAN 4.0:更新的数据库,用于鉴定植物启动子中保守的非编码序列和探索动态转录调控。
Nucleic Acids Res. 2024 Jan 5;52(D1):D1569-D1578. doi: 10.1093/nar/gkad945.

本文引用的文献

1
Sensitive protein alignments at tree-of-life scale using DIAMOND.使用 DIAMOND 进行生命之树尺度上的敏感蛋白质比对。
Nat Methods. 2021 Apr;18(4):366-368. doi: 10.1038/s41592-021-01101-x. Epub 2021 Apr 7.
2
Ten Years of Collaborative Progress in the Quest for Orthologs.寻找同源基因的十年协同进展。
Mol Biol Evol. 2021 Jul 29;38(8):3033-3045. doi: 10.1093/molbev/msab098.
3
UniProt: the universal protein knowledgebase in 2021.UniProt:2021 年的通用蛋白质知识库。
Nucleic Acids Res. 2021 Jan 8;49(D1):D480-D489. doi: 10.1093/nar/gkaa1100.
4
The Quest for Orthologs benchmark service and consensus calls in 2020.2020 年寻找直系同源物基准服务和共识调用。
Nucleic Acids Res. 2020 Jul 2;48(W1):W538-W545. doi: 10.1093/nar/gkaa308.
5
OrthoFinder: phylogenetic orthology inference for comparative genomics.OrthoFinder:用于比较基因组学的系统发育直系同源推断。
Genome Biol. 2019 Nov 14;20(1):238. doi: 10.1186/s13059-019-1832-y.
6
SonicParanoid: fast, accurate and easy orthology inference.SonicParanoid:快速、准确、易用的直系同源推断。
Bioinformatics. 2019 Jan 1;35(1):149-151. doi: 10.1093/bioinformatics/bty631.
7
MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets.MMseqs2支持进行灵敏的蛋白质序列搜索,以分析海量数据集。
Nat Biotechnol. 2017 Nov;35(11):1026-1028. doi: 10.1038/nbt.3988. Epub 2017 Oct 16.
8
Standardized benchmarking in the quest for orthologs.寻找直系同源基因过程中的标准化基准测试。
Nat Methods. 2016 May;13(5):425-30. doi: 10.1038/nmeth.3830. Epub 2016 Apr 4.
9
Resolving the ortholog conjecture: orthologs tend to be weakly, but significantly, more similar in function than paralogs.解决直系同源推断问题:直系同源物在功能上往往更相似,但程度较弱,显著强于旁系同源物。
PLoS Comput Biol. 2012;8(5):e1002514. doi: 10.1371/journal.pcbi.1002514. Epub 2012 May 17.
10
Proteinortho: detection of (co-)orthologs in large-scale analysis.蛋白质直系同源物分析:大规模分析中的(共)直系同源物检测。
BMC Bioinformatics. 2011 Apr 28;12:124. doi: 10.1186/1471-2105-12-124.