• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用Hieranoid 2改进直系同源推断。

Improved orthology inference with Hieranoid 2.

作者信息

Kaduk Mateusz, Sonnhammer Erik

机构信息

Department of Biochemistry and Biophysics, Stockholm University.

Science for Life Laboratory (SciLifeLab), Tomtebodavagen 23, Solna, Sweden.

出版信息

Bioinformatics. 2017 Apr 15;33(8):1154-1159. doi: 10.1093/bioinformatics/btw774.

DOI:10.1093/bioinformatics/btw774
PMID:28096085
Abstract

MOTIVATION

The initial step in many orthology inference methods is the computationally demanding establishment of all pairwise protein similarities across all analysed proteomes. The quadratic scaling with proteomes has become a major bottleneck. A remedy is offered by the Hieranoid algorithm which reduces the complexity to linear by hierarchically aggregating ortholog groups from InParanoid along a species tree.

RESULTS

We have further developed the Hieranoid algorithm in many ways. Major improvements have been made to the construction of multiple sequence alignments and consensus sequences. Hieranoid version 2 was evaluated with standard benchmarks that reveal a dramatic increase in the coverage/accuracy tradeoff over version 1, such that it now compares favourably with the best methods. The new parallelized cluster mode allows Hieranoid to be run on large data sets in a much shorter timespan than InParanoid, yet at similar accuracy.

CONTACT

mateusz.kaduk@scilifelab.se.

AVAILABILITY AND IMPLEMENTATION

Perl code freely available at http://hieranoid.sbc.su.se/ .

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

许多直系同源推断方法的第一步是在所有分析的蛋白质组中建立所有成对蛋白质相似性,这在计算上要求很高。随着蛋白质组数量的增加,计算量呈二次方增长,这已成为一个主要瓶颈。Hieranoid算法提供了一种解决方案,它通过沿着物种树层次化地聚合来自InParanoid的直系同源组,将复杂度降低到线性。

结果

我们在许多方面进一步开发了Hieranoid算法。对多序列比对和共有序列的构建进行了重大改进。使用标准基准对Hieranoid版本2进行了评估,结果表明与版本1相比,覆盖范围/准确性权衡有了显著提高,现在与最佳方法相比也毫不逊色。新的并行化集群模式使Hieranoid能够在比InParanoid短得多的时间内处理大型数据集,且准确性相似。

联系方式

mateusz.kaduk@scilifelab.se。

可用性和实现方式

Perl代码可从http://hieranoid.sbc.su.se/免费获取。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
Improved orthology inference with Hieranoid 2.使用Hieranoid 2改进直系同源推断。
Bioinformatics. 2017 Apr 15;33(8):1154-1159. doi: 10.1093/bioinformatics/btw774.
2
Hieranoid: hierarchical orthology inference.Hieranoid:层次同源推断。
J Mol Biol. 2013 Jun 12;425(11):2072-2081. doi: 10.1016/j.jmb.2013.02.018. Epub 2013 Feb 26.
3
HieranoiDB: a database of orthologs inferred by Hieranoid.HieranoiDB:一个由Hieranoid推断出的直系同源基因数据库。
Nucleic Acids Res. 2017 Jan 4;45(D1):D687-D690. doi: 10.1093/nar/gkw923. Epub 2016 Oct 13.
4
InParanoid 7: new algorithms and tools for eukaryotic orthology analysis.InParanoid 7:真核生物直系同源分析的新算法和工具。
Nucleic Acids Res. 2010 Jan;38(Database issue):D196-203. doi: 10.1093/nar/gkp931. Epub 2009 Nov 5.
5
InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic.InParanoid 8:273个蛋白质组之间的直系同源分析,大部分为真核生物蛋白质组。
Nucleic Acids Res. 2015 Jan;43(Database issue):D234-9. doi: 10.1093/nar/gku1203. Epub 2014 Nov 27.
6
Fuse: multiple network alignment via data fusion.Fuse:通过数据融合进行多重网络比对。
Bioinformatics. 2016 Apr 15;32(8):1195-203. doi: 10.1093/bioinformatics/btv731. Epub 2015 Dec 14.
7
InParanoid-DIAMOND: faster orthology analysis with the InParanoid algorithm.InParanoid-DIAMOND:使用 InParanoid 算法进行更快的同源分析。
Bioinformatics. 2022 May 13;38(10):2918-2919. doi: 10.1093/bioinformatics/btac194.
8
transAlign: using amino acids to facilitate the multiple alignment of protein-coding DNA sequences.transAlign:利用氨基酸促进蛋白质编码DNA序列的多重比对。
BMC Bioinformatics. 2005 Jun 22;6:156. doi: 10.1186/1471-2105-6-156.
9
Automatic clustering of orthologs and inparalogs shared by multiple proteomes.多个蛋白质组共有的直系同源基因和旁系同源基因的自动聚类。
Bioinformatics. 2006 Jul 15;22(14):e9-15. doi: 10.1093/bioinformatics/btl213.
10
ARACNe-AP: gene network reverse engineering through adaptive partitioning inference of mutual information.ARACNe-AP:通过互信息的自适应划分推断进行基因网络反向工程
Bioinformatics. 2016 Jul 15;32(14):2233-5. doi: 10.1093/bioinformatics/btw216. Epub 2016 Apr 23.

引用本文的文献

1
Feature Architecture-Aware Ortholog Search With fDOG Reveals the Distribution of Plant Cell Wall-Degrading Enzymes Across Life.基于fDOG的特征架构感知直系同源物搜索揭示了植物细胞壁降解酶在生命中的分布。
Mol Biol Evol. 2025 Jun 4;42(6). doi: 10.1093/molbev/msaf120.
2
Informatic challenges and advances in illuminating the druggable proteome.阐明可成药蛋白质组中的信息学挑战与进展。
Drug Discov Today. 2024 Mar;29(3):103894. doi: 10.1016/j.drudis.2024.103894. Epub 2024 Jan 22.
3
Leveraging genomic redundancy to improve inference and alignment of orthologous proteins.
利用基因组冗余来提高同源蛋白的推断和比对。
G3 (Bethesda). 2023 Dec 6;13(12). doi: 10.1093/g3journal/jkad222.
4
OrthoPhy: A Program to Construct Ortholog Data Sets Using Taxonomic Information.OrthoPhy:使用分类信息构建直系同源数据的程序。
Genome Biol Evol. 2023 Mar 3;15(3). doi: 10.1093/gbe/evad026.
5
Cross-species cell-type assignment from single-cell RNA-seq data by a heterogeneous graph neural network.基于异质图神经网络的单细胞 RNA-seq 数据的跨物种细胞类型分配。
Genome Res. 2023 Jan;33(1):96-111. doi: 10.1101/gr.276868.122. Epub 2022 Dec 16.
6
New data and collaborations at the Saccharomyces Genome Database: updated reference genome, alleles, and the Alliance of Genome Resources.酿酒酵母基因组数据库的新数据和新合作:更新的参考基因组、等位基因和基因组资源联盟。
Genetics. 2022 Apr 4;220(4). doi: 10.1093/genetics/iyab224.
7
Hybrid Deep Learning Based on a Heterogeneous Network Profile for Functional Annotations of Genes.基于异构网络特征的混合深度学习方法用于基因功能注释
Int J Mol Sci. 2021 Sep 16;22(18):10019. doi: 10.3390/ijms221810019.
8
KinOrtho: a method for mapping human kinase orthologs across the tree of life and illuminating understudied kinases.KinOrtho:一种在生命之树中映射人类激酶直系同源物并阐明研究不足的激酶的方法。
BMC Bioinformatics. 2021 Sep 18;22(1):446. doi: 10.1186/s12859-021-04358-3.
9
Ten Years of Collaborative Progress in the Quest for Orthologs.寻找同源基因的十年协同进展。
Mol Biol Evol. 2021 Jul 29;38(8):3033-3045. doi: 10.1093/molbev/msab098.
10
FlyRNAi.org-the database of the Drosophila RNAi screening center and transgenic RNAi project: 2021 update.FlyRNAi.org——果蝇 RNAi 筛选中心和转基因 RNAi 项目数据库:2021 年更新。
Nucleic Acids Res. 2021 Jan 8;49(D1):D908-D915. doi: 10.1093/nar/gkaa936.