• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Wei2GO:基于加权序列相似性的蛋白质功能预测。

Wei2GO: weighted sequence similarity-based protein function prediction.

机构信息

Department of Ecology and Evolution, University of Lausanne, Lausanne, Switzerland.

Swiss Institute of Bioinformatics, Lausanne, Switzerland.

出版信息

PeerJ. 2022 Feb 15;10:e12931. doi: 10.7717/peerj.12931. eCollection 2022.

DOI:10.7717/peerj.12931
PMID:35186498
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8855713/
Abstract

BACKGROUND

Protein function prediction is an important part of bioinformatics and genomics studies. There are many different predictors available, however most of these are in the form of web-servers instead of open-source locally installable versions. Such local versions are necessary to perform large scale genomics studies due to the presence of limitations imposed by web servers such as queues, prediction speed, and updatability of databases.

METHODS

This paper describes Wei2GO: a weighted sequence similarity and python-based open-source protein function prediction software. It uses DIAMOND and HMMScan sequence alignment searches against the UniProtKB and Pfam databases respectively, transfers Gene Ontology terms from the reference protein to the query protein, and uses a weighing algorithm to calculate a score for the Gene Ontology annotations.

RESULTS

Wei2GO is compared against the Argot2 and Argot2.5 web servers, which use a similar concept, and DeepGOPlus which acts as a reference. Wei2GO shows an increase in performance according to precision and recall curves, F scores, and S scores for biological process and molecular function ontologies. Computational time compared to Argot2 and Argot2.5 is decreased from several hours to several minutes.

AVAILABILITY

Wei2GO is written in Python 3, and can be found at https://gitlab.com/mreijnders/Wei2GO.

摘要

背景

蛋白质功能预测是生物信息学和基因组学研究的重要组成部分。有许多不同的预测器可供选择,但其中大多数都是网络服务器的形式,而不是可本地安装的开源版本。由于网络服务器存在队列、预测速度和数据库更新性等限制,因此需要本地版本才能进行大规模的基因组学研究。

方法

本文介绍了 Wei2GO:一种基于加权序列相似性和 Python 的开源蛋白质功能预测软件。它使用 DIAMOND 和 HMMScan 序列比对搜索分别针对 UniProtKB 和 Pfam 数据库,将基因本体论术语从参考蛋白转移到查询蛋白,并使用加权算法计算基因本体论注释的分数。

结果

Wei2GO 与使用类似概念的 Argot2 和 Argot2.5 网络服务器以及作为参考的 DeepGOPlus 进行了比较。根据精度和召回率曲线、F 分数和生物学过程和分子功能本体论的 S 分数,Wei2GO 的性能有所提高。与 Argot2 和 Argot2.5 相比,计算时间从数小时减少到数分钟。

可用性

Wei2GO 是用 Python 3 编写的,可以在 https://gitlab.com/mreijnders/Wei2GO 找到。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d250/8855713/ace69b5d2e85/peerj-10-12931-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d250/8855713/ace69b5d2e85/peerj-10-12931-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d250/8855713/ace69b5d2e85/peerj-10-12931-g001.jpg

相似文献

1
Wei2GO: weighted sequence similarity-based protein function prediction.Wei2GO:基于加权序列相似性的蛋白质功能预测。
PeerJ. 2022 Feb 15;10:e12931. doi: 10.7717/peerj.12931. eCollection 2022.
2
Argot2: a large scale function prediction tool relying on semantic similarity of weighted Gene Ontology terms.Argot2:一个大规模的功能预测工具,依赖于加权基因本体术语的语义相似性。
BMC Bioinformatics. 2012 Mar 28;13 Suppl 4(Suppl 4):S14. doi: 10.1186/1471-2105-13-S4-S14.
3
Enhancing protein function prediction with taxonomic constraints--The Argot2.5 web server.利用分类学限制增强蛋白质功能预测——Argot2.5网络服务器
Methods. 2016 Jan 15;93:15-23. doi: 10.1016/j.ymeth.2015.08.021. Epub 2015 Aug 28.
4
PANNZER2: a rapid functional annotation web server.PANNZER2:一个快速的功能注释网络服务器。
Nucleic Acids Res. 2018 Jul 2;46(W1):W84-W88. doi: 10.1093/nar/gky350.
5
Using PFP and ESG Protein Function Prediction Web Servers.使用PFP和ESG蛋白质功能预测网络服务器。
Methods Mol Biol. 2017;1611:1-14. doi: 10.1007/978-1-4939-7015-5_1.
6
PFP/ESG: automated protein function prediction servers enhanced with Gene Ontology visualization tool.PFP/ESG:通过基因本体可视化工具增强的自动化蛋白质功能预测服务器。
Bioinformatics. 2015 Jan 15;31(2):271-2. doi: 10.1093/bioinformatics/btu646. Epub 2014 Oct 1.
7
Mutual annotation-based prediction of protein domain functions with Domain2GO.基于互注释的蛋白质结构域功能预测与 Domain2GO。
Protein Sci. 2024 Jun;33(6):e4988. doi: 10.1002/pro.4988.
8
HH-suite3 for fast remote homology detection and deep protein annotation.HH-suite3 用于快速远程同源检测和深度蛋白质注释。
BMC Bioinformatics. 2019 Sep 14;20(1):473. doi: 10.1186/s12859-019-3019-7.
9
PANNZER-A practical tool for protein function prediction.PANNZER——一种用于蛋白质功能预测的实用工具。
Protein Sci. 2022 Jan;31(1):118-128. doi: 10.1002/pro.4193. Epub 2021 Oct 14.
10
GOThresher: a program to remove annotation biases from protein function annotation datasets.GOThresher:一个用于去除蛋白质功能注释数据集中注释偏差的程序。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad048.

引用本文的文献

1
DIAMOND2GO: rapid Gene Ontology assignment and enrichment detection for functional genomics.DIAMOND2GO:用于功能基因组学的快速基因本体分配与富集检测
Front Bioinform. 2025 Aug 15;5:1634042. doi: 10.3389/fbinf.2025.1634042. eCollection 2025.
2
In silico protein function prediction: the rise of machine learning-based approaches.计算机模拟蛋白质功能预测:基于机器学习方法的兴起
Med Rev (2021). 2023 Nov 29;3(6):487-510. doi: 10.1515/mr-2023-0038. eCollection 2023 Dec.
3
Eusocial Transition in Blattodea: Transposable Elements and Shifts of Gene Expression.

本文引用的文献

1
CrowdGO: Machine learning and semantic similarity guided consensus Gene Ontology annotation.CrowdGO:基于机器学习和语义相似性的共识基因本体论注释。
PLoS Comput Biol. 2022 May 13;18(5):e1010075. doi: 10.1371/journal.pcbi.1010075. eCollection 2022 May.
2
Sustainable data analysis with Snakemake.使用 Snakemake 进行可持续数据分析。
F1000Res. 2021 Jan 18;10:33. doi: 10.12688/f1000research.29032.2. eCollection 2021.
3
The InterPro protein families and domains database: 20 years on.The InterPro 蛋白质家族和结构域数据库:20 年的发展历程。
直翅目昆虫的社会性过渡:转座元件和基因表达的转变。
Genes (Basel). 2022 Oct 26;13(11):1948. doi: 10.3390/genes13111948.
4
CrowdGO: Machine learning and semantic similarity guided consensus Gene Ontology annotation.CrowdGO:基于机器学习和语义相似性的共识基因本体论注释。
PLoS Comput Biol. 2022 May 13;18(5):e1010075. doi: 10.1371/journal.pcbi.1010075. eCollection 2022 May.
5
Convergent evolution of venom gland transcriptomes across Metazoa.后生动物毒液腺转录组的趋同进化。
Proc Natl Acad Sci U S A. 2022 Jan 4;119(1). doi: 10.1073/pnas.2111392119.
6
Comparative genomics reveals a core gene toolbox for lifestyle transitions in Hypocreales fungi.比较基因组学揭示了 Hypocreales 真菌生活方式转变的核心基因工具包。
Environ Microbiol. 2021 Jun;23(6):3251-3264. doi: 10.1111/1462-2920.15554. Epub 2021 May 11.
Nucleic Acids Res. 2021 Jan 8;49(D1):D344-D354. doi: 10.1093/nar/gkaa977.
4
The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens.CAFA 挑战赛报告称,通过实验筛选,提高了数百个基因的蛋白质功能预测和新的功能注释。
Genome Biol. 2019 Nov 19;20(1):244. doi: 10.1186/s13059-019-1835-8.
5
DeepGOPlus: improved protein function prediction from sequence.DeepGOPlus:从序列中改进蛋白质功能预测。
Bioinformatics. 2020 Jan 15;36(2):422-429. doi: 10.1093/bioinformatics/btz595.
6
The Gene Ontology Resource: 20 years and still GOing strong.《基因本体论资源:20 年,持续强大》
Nucleic Acids Res. 2019 Jan 8;47(D1):D330-D338. doi: 10.1093/nar/gky1055.
7
UniProt: a worldwide hub of protein knowledge.UniProt:蛋白质知识的全球枢纽。
Nucleic Acids Res. 2019 Jan 8;47(D1):D506-D515. doi: 10.1093/nar/gky1049.
8
The Pfam protein families database in 2019.2019 年 Pfam 蛋白质家族数据库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D427-D432. doi: 10.1093/nar/gky995.
9
Enhancing protein function prediction with taxonomic constraints--The Argot2.5 web server.利用分类学限制增强蛋白质功能预测——Argot2.5网络服务器
Methods. 2016 Jan 15;93:15-23. doi: 10.1016/j.ymeth.2015.08.021. Epub 2015 Aug 28.
10
Fast and sensitive protein alignment using DIAMOND.使用 DIAMOND 进行快速灵敏的蛋白质比对。
Nat Methods. 2015 Jan;12(1):59-60. doi: 10.1038/nmeth.3176. Epub 2014 Nov 17.