• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用GOstruct方法对基因本体术语进行层次分类。

Hierarchical classification of gene ontology terms using the GOstruct method.

作者信息

Sokolov Artem, Ben-Hur Asa

机构信息

Department of Computer Science, Colorado State University, Fort Collins, CO 80523, USA.

出版信息

J Bioinform Comput Biol. 2010 Apr;8(2):357-76. doi: 10.1142/s0219720010004744.

DOI:10.1142/s0219720010004744
PMID:20401950
Abstract

Protein function prediction is an active area of research in bioinformatics. Yet, the transfer of annotation on the basis of sequence or structural similarity remains widely used as an annotation method. Most of today's machine learning approaches reduce the problem to a collection of binary classification problems: whether a protein performs a particular function, sometimes with a post-processing step to combine the binary outputs. We propose a method that directly predicts a full functional annotation of a protein by modeling the structure of the Gene Ontology hierarchy in the framework of kernel methods for structured-output spaces. Our empirical results show improved performance over a BLAST nearest-neighbor method, and over algorithms that employ a collection of binary classifiers as measured on the Mousefunc benchmark dataset.

摘要

蛋白质功能预测是生物信息学中一个活跃的研究领域。然而,基于序列或结构相似性进行注释转移仍然被广泛用作一种注释方法。当今大多数机器学习方法将该问题简化为一系列二元分类问题:即一种蛋白质是否执行特定功能,有时还会有一个后处理步骤来组合二元输出。我们提出了一种方法,该方法通过在结构化输出空间的核方法框架内对基因本体层次结构进行建模,直接预测蛋白质的完整功能注释。我们的实证结果表明,与BLAST最近邻方法以及在Mousefunc基准数据集上进行测量时使用二元分类器集合的算法相比,我们的方法性能有所提高。

相似文献

1
Hierarchical classification of gene ontology terms using the GOstruct method.使用GOstruct方法对基因本体术语进行层次分类。
J Bioinform Comput Biol. 2010 Apr;8(2):357-76. doi: 10.1142/s0219720010004744.
2
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.
3
FuzzyART neural network for protein classification.用于蛋白质分类的模糊ART神经网络。
J Bioinform Comput Biol. 2010 Oct;8(5):825-41. doi: 10.1142/s0219720010004951.
4
A Protein Classification Benchmark collection for machine learning.一个用于机器学习的蛋白质分类基准数据集。
Nucleic Acids Res. 2007 Jan;35(Database issue):D232-6. doi: 10.1093/nar/gkl812. Epub 2006 Nov 16.
5
Artificial intelligence techniques for bioinformatics.用于生物信息学的人工智能技术
Appl Bioinformatics. 2002;1(4):191-222.
6
Information theory applied to the sparse gene ontology annotation network to predict novel gene function.信息论应用于稀疏基因本体注释网络以预测新的基因功能。
Bioinformatics. 2007 Jul 1;23(13):i529-38. doi: 10.1093/bioinformatics/btm195.
7
Recent progresses in the application of machine learning approach for predicting protein functional class independent of sequence similarity.机器学习方法在预测与序列相似性无关的蛋白质功能类别应用中的最新进展。
Proteomics. 2006 Jul;6(14):4023-37. doi: 10.1002/pmic.200500938.
8
A statistical framework for genomic data fusion.基因组数据融合的统计框架。
Bioinformatics. 2004 Nov 1;20(16):2626-35. doi: 10.1093/bioinformatics/bth294. Epub 2004 May 6.
9
Incorporating functional inter-relationships into protein function prediction algorithms.将功能相互关系纳入蛋白质功能预测算法。
BMC Bioinformatics. 2009 May 12;10:142. doi: 10.1186/1471-2105-10-142.
10
Combining heterogeneous data sources for accurate functional annotation of proteins.整合异构数据源以实现蛋白质功能注释的准确性。
BMC Bioinformatics. 2013;14 Suppl 3(Suppl 3):S10. doi: 10.1186/1471-2105-14-S3-S10. Epub 2013 Feb 28.

引用本文的文献

1
Bacterial species identification using MALDI-TOF mass spectrometry and machine learning techniques: A large-scale benchmarking study.使用基质辅助激光解吸电离飞行时间质谱和机器学习技术进行细菌物种鉴定:一项大规模基准研究
Comput Struct Biotechnol J. 2021 Nov 9;19:6157-6168. doi: 10.1016/j.csbj.2021.11.004. eCollection 2021.
2
Semantic similarity and machine learning with ontologies.语义相似性和本体论的机器学习。
Brief Bioinform. 2021 Jul 20;22(4). doi: 10.1093/bib/bbaa199.
3
Use of Chou's 5-steps rule to predict the subcellular localization of gram-negative and gram-positive bacterial proteins by multi-label learning based on gene ontology annotation and profile alignment.
利用 Chou 的 5 步规则,通过基于基因本体论注释和序列比对的多标签学习,预测革兰氏阴性和革兰氏阳性细菌蛋白质的亚细胞定位。
J Integr Bioinform. 2020 Jun 29;18(1):51-79. doi: 10.1515/jib-2019-0091.
4
The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens.CAFA 挑战赛报告称,通过实验筛选,提高了数百个基因的蛋白质功能预测和新的功能注释。
Genome Biol. 2019 Nov 19;20(1):244. doi: 10.1186/s13059-019-1835-8.
5
Combining learning and constraints for genome-wide protein annotation.联合学习与约束进行全基因组蛋白注释。
BMC Bioinformatics. 2019 Jun 17;20(1):338. doi: 10.1186/s12859-019-2875-5.
6
The evolutionary signal in metagenome phyletic profiles predicts many gene functions.元基因组系统发育分布中的进化信号可预测多种基因功能。
Microbiome. 2018 Jul 10;6(1):129. doi: 10.1186/s40168-018-0506-4.
7
Enumerating consistent sub-graphs of directed acyclic graphs: an insight into biomedical ontologies.枚举有向无环图的一致子图:生物医学本体论的一个见解。
Bioinformatics. 2018 Jul 1;34(13):i313-i322. doi: 10.1093/bioinformatics/bty268.
8
ProLanGO: Protein Function Prediction Using Neural Machine Translation Based on a Recurrent Neural Network.ProLanGO:基于循环神经网络的神经机器翻译在蛋白质功能预测中的应用。
Molecules. 2017 Oct 17;22(10):1732. doi: 10.3390/molecules22101732.
9
DeepGO: predicting protein functions from sequence and interactions using a deep ontology-aware classifier.DeepGO:使用深度本体感知分类器从序列和相互作用预测蛋白质功能。
Bioinformatics. 2018 Feb 15;34(4):660-668. doi: 10.1093/bioinformatics/btx624.
10
Prediction of Human Phenotype Ontology terms by means of hierarchical ensemble methods.通过分层集成方法预测人类表型本体术语
BMC Bioinformatics. 2017 Oct 12;18(1):449. doi: 10.1186/s12859-017-1854-y.