• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SonicParanoid:快速、准确、易用的直系同源推断。

SonicParanoid: fast, accurate and easy orthology inference.

机构信息

Department of Biological Sciences, Graduate School of Science, The University of Tokyo, Tokyo, Japan.

Department of Computational Biology and Medical Sciences, Graduate School of Frontier Sciences, The University of Tokyo, Chiba, Japan.

出版信息

Bioinformatics. 2019 Jan 1;35(1):149-151. doi: 10.1093/bioinformatics/bty631.

DOI:10.1093/bioinformatics/bty631
PMID:30032301
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6298048/
Abstract

MOTIVATION

Orthology inference constitutes a common base of many genome-based studies, as a pre-requisite for annotating new genomes, finding target genes for biotechnological applications and revealing the evolutionary history of life. Although its importance keeps rising with the ever-growing number of sequenced genomes, existing tools are computationally demanding and difficult to employ.

RESULTS

Here, we present SonicParanoid, which is faster than, but comparably accurate to, the well-established tools with a balanced precision-recall trade-off. Furthermore, SonicParanoid substantially relieves the difficulties of orthology inference for those who need to construct and maintain their own genomic datasets.

AVAILABILITY AND IMPLEMENTATION

SonicParanoid is available with a GNU GPLv3 license on the Python Package Index and BitBucket. Documentation is available at http://iwasakilab.bs.s.u-tokyo.ac.jp/sonicparanoid.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

同源基因推断是许多基于基因组的研究的共同基础,是注释新基因组、寻找生物技术应用的目标基因和揭示生命进化历史的前提。尽管随着测序基因组数量的不断增加,其重要性不断提高,但现有的工具计算要求高,难以使用。

结果

在这里,我们提出了 SonicParanoid,它比成熟的工具更快,但准确性相当,具有平衡的精度-召回权衡。此外,SonicParanoid 大大减轻了那些需要构建和维护自己基因组数据集的人进行同源基因推断的困难。

可用性和实现

SonicParanoid 可在 Python 包索引和 BitBucket 上使用 GNU GPLv3 许可证获得。文档可在 http://iwasakilab.bs.s.u-tokyo.ac.jp/sonicparanoid 上获得。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/929a/6298048/b6844c97cff5/bty631f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/929a/6298048/b6844c97cff5/bty631f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/929a/6298048/b6844c97cff5/bty631f1.jpg

相似文献

1
SonicParanoid: fast, accurate and easy orthology inference.SonicParanoid:快速、准确、易用的直系同源推断。
Bioinformatics. 2019 Jan 1;35(1):149-151. doi: 10.1093/bioinformatics/bty631.
2
SonicParanoid2: fast, accurate, and comprehensive orthology inference with machine learning and language models.SonicParanoid2:使用机器学习和语言模型实现快速、准确、全面的直系同源推断。
Genome Biol. 2024 Jul 25;25(1):195. doi: 10.1186/s13059-024-03298-4.
3
Accurate identification of orthologous segments among multiple genomes.准确识别多个基因组之间的直系同源片段。
Bioinformatics. 2009 Apr 1;25(7):853-60. doi: 10.1093/bioinformatics/btp070. Epub 2009 Feb 2.
4
Pybedtools: a flexible Python library for manipulating genomic datasets and annotations.Pybedtools:一个灵活的 Python 库,用于操作基因组数据集和注释。
Bioinformatics. 2011 Dec 15;27(24):3423-4. doi: 10.1093/bioinformatics/btr539. Epub 2011 Sep 23.
5
GeneSpy, a user-friendly and flexible genomic context visualizer.基因间谍,一个用户友好且灵活的基因组上下文可视化工具。
Bioinformatics. 2019 Jan 15;35(2):329-331. doi: 10.1093/bioinformatics/bty459.
6
Simulating Illumina metagenomic data with InSilicoSeq.用 InSilicoSeq 模拟 Illumina 宏基因组数据。
Bioinformatics. 2019 Feb 1;35(3):521-522. doi: 10.1093/bioinformatics/bty630.
7
MultiQC: summarize analysis results for multiple tools and samples in a single report.MultiQC:在一份报告中汇总多个工具和样本的分析结果。
Bioinformatics. 2016 Oct 1;32(19):3047-8. doi: 10.1093/bioinformatics/btw354. Epub 2016 Jun 16.
8
DFAST: a flexible prokaryotic genome annotation pipeline for faster genome publication.DFAST:一个灵活的原核生物基因组注释管道,用于更快地发布基因组。
Bioinformatics. 2018 Mar 15;34(6):1037-1039. doi: 10.1093/bioinformatics/btx713.
9
Standardized benchmarking in the quest for orthologs.寻找直系同源基因过程中的标准化基准测试。
Nat Methods. 2016 May;13(5):425-30. doi: 10.1038/nmeth.3830. Epub 2016 Apr 4.
10
SoFIA: a data integration framework for annotating high-throughput datasets.SoFIA:一个用于注释高通量数据集的数据集成框架。
Bioinformatics. 2016 Sep 1;32(17):2590-7. doi: 10.1093/bioinformatics/btw302. Epub 2016 May 13.

引用本文的文献

1
Adaptive loss of shortwave-sensitive opsins during cartilaginous fish evolution.软骨鱼类进化过程中短波敏感视蛋白的适应性丧失。
Nat Commun. 2025 Aug 18;16(1):7684. doi: 10.1038/s41467-025-62544-w.
2
Unraveling developmental gene regulation in holometabolous insects through comparative transcriptomics and proteomics.通过比较转录组学和蛋白质组学揭示全变态昆虫的发育基因调控
Commun Biol. 2025 Jul 1;8(1):980. doi: 10.1038/s42003-025-08414-z.
3
M1CR0B1AL1Z3R 2.0: an enhanced web server for comparative analysis of bacterial genomes at scale.

本文引用的文献

1
MMseqs2 enables sensitive protein sequence searching for the analysis of massive data sets.MMseqs2支持进行灵敏的蛋白质序列搜索,以分析海量数据集。
Nat Biotechnol. 2017 Nov;35(11):1026-1028. doi: 10.1038/nbt.3988. Epub 2017 Oct 16.
2
Orthologous Matrix (OMA) algorithm 2.0: more robust to asymmetric evolutionary rates and more scalable hierarchical orthologous group inference.直系同源矩阵(OMA)算法2.0:对不对称进化速率更具鲁棒性,且在分层直系同源组推断方面更具扩展性。
Bioinformatics. 2017 Jul 15;33(14):i75-i82. doi: 10.1093/bioinformatics/btx229.
3
Improved orthology inference with Hieranoid 2.
微生物分析器2.0:一个用于大规模细菌基因组比较分析的增强型网络服务器。
Nucleic Acids Res. 2025 Jul 7;53(W1):W369-W375. doi: 10.1093/nar/gkaf413.
4
AlgaeOrtho, a bioinformatics tool for processing ortholog inference results in algae.AlgaeOrtho,一种用于处理藻类直系同源基因推断结果的生物信息学工具。
Front Microbiol. 2025 Mar 4;16:1541898. doi: 10.3389/fmicb.2025.1541898. eCollection 2025.
5
zol and fai: large-scale targeted detection and evolutionary investigation of gene clusters.佐尔和法伊:基因簇的大规模靶向检测与进化研究
Nucleic Acids Res. 2025 Jan 24;53(3). doi: 10.1093/nar/gkaf045.
6
Different orthology inference algorithms generate similar predicted orthogroups among Brassicaceae species.不同的直系同源推断算法在十字花科物种中生成相似的预测直系同源组。
Appl Plant Sci. 2024 Dec 25;13(1):e11627. doi: 10.1002/aps3.11627. eCollection 2025 Jan-Feb.
7
Convergent Evolution and Predictability of Gene Copy Numbers Associated with Diets in Mammals.哺乳动物中与饮食相关的基因拷贝数的趋同进化与可预测性
Genome Biol Evol. 2025 Feb 3;17(2). doi: 10.1093/gbe/evaf008.
8
A metric and its derived protein network for evaluation of ortholog database inconsistency.一种用于评估直系同源数据库不一致性的度量标准及其衍生的蛋白质网络。
BMC Bioinformatics. 2025 Jan 7;26(1):6. doi: 10.1186/s12859-024-06023-x.
9
Orthology inference at scale with FastOMA.使用FastOMA进行大规模直系同源推断。
Nat Methods. 2025 Feb;22(2):269-272. doi: 10.1038/s41592-024-02552-8. Epub 2025 Jan 3.
10
De novo sequencing allows genome-wide identification of genes involved in galactomannan synthesis in locust bean (Ceratonia siliqua).从头测序能够在全基因组范围内鉴定刺槐豆(角豆树)中参与半乳甘露聚糖合成的基因。
DNA Res. 2024 Dec 1;31(6). doi: 10.1093/dnares/dsae033.
使用Hieranoid 2改进直系同源推断。
Bioinformatics. 2017 Apr 15;33(8):1154-1159. doi: 10.1093/bioinformatics/btw774.
4
PANTHER version 11: expanded annotation data from Gene Ontology and Reactome pathways, and data analysis tool enhancements.PANTHER 版本 11:来自基因本体论和 Reactome 通路的注释数据扩展,以及数据分析工具增强。
Nucleic Acids Res. 2017 Jan 4;45(D1):D183-D189. doi: 10.1093/nar/gkw1138. Epub 2016 Nov 29.
5
Standardized benchmarking in the quest for orthologs.寻找直系同源基因过程中的标准化基准测试。
Nat Methods. 2016 May;13(5):425-30. doi: 10.1038/nmeth.3830. Epub 2016 Apr 4.
6
The International Nucleotide Sequence Database Collaboration.国际核苷酸序列数据库协作组织。
Nucleic Acids Res. 2016 Jan 4;44(D1):D48-50. doi: 10.1093/nar/gkv1323. Epub 2015 Dec 10.
7
OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy.OrthoFinder:解决全基因组比较中的基本偏差可显著提高直系同源组推断准确性。
Genome Biol. 2015 Aug 6;16(1):157. doi: 10.1186/s13059-015-0721-2.
8
InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic.InParanoid 8:273个蛋白质组之间的直系同源分析,大部分为真核生物蛋白质组。
Nucleic Acids Res. 2015 Jan;43(Database issue):D234-9. doi: 10.1093/nar/gku1203. Epub 2014 Nov 27.
9
Fast and sensitive protein alignment using DIAMOND.使用 DIAMOND 进行快速灵敏的蛋白质比对。
Nat Methods. 2015 Jan;12(1):59-60. doi: 10.1038/nmeth.3176. Epub 2014 Nov 17.
10
Inferring orthology and paralogy.推断直系同源和旁系同源关系。
Methods Mol Biol. 2012;855:259-79. doi: 10.1007/978-1-61779-582-4_9.