Suppr超能文献

基于支持向量机的粘蛋白型O-连接糖基化位点预测:使用增强型序列特征编码

Support vector machine-based mucin-type o-linked glycosylation site prediction using enhanced sequence feature encoding.

作者信息

Torii Manabu, Liu Hongfang, Hu Zhang-Zhi

机构信息

ISIS Center.

出版信息

AMIA Annu Symp Proc. 2009 Nov 14;2009:640-4.

Abstract

Glycosylation is a common and complex protein post-translational modification (PTM). In particular, mucin-type O-linked glycosylation is abundant and plays important biological functions. The number of determined glycosylation sites is still small and there remains the need of accurate computational prediction for annotation and functional understanding of proteins. PTM site prediction can be formulated as a machine learning task. An important step in applying machine learning to this task is encoding protein fragments as feature vectors. Here we assess existing encoding methods as well as an enhanced encoding method named composition of monomer spectrum (CMS) using support vector machines (SVMs). SVMs employing the existing encoding methods achieved AUC (area under ROC curve) of 90.3-91.3%, and ones employing CMS achieved AUC of 92.4%. Analysis of different encoding methods suggests the potential in further improving the prediction.

摘要

糖基化是一种常见且复杂的蛋白质翻译后修饰(PTM)。特别是,粘蛋白型O-连接糖基化丰富且具有重要的生物学功能。已确定的糖基化位点数量仍然很少,对于蛋白质的注释和功能理解仍需要准确的计算预测。PTM位点预测可以被表述为一个机器学习任务。将机器学习应用于该任务的一个重要步骤是将蛋白质片段编码为特征向量。在这里,我们使用支持向量机(SVM)评估现有的编码方法以及一种名为单体谱组成(CMS)的增强编码方法。采用现有编码方法的支持向量机获得的ROC曲线下面积(AUC)为90.3 - 91.3%,而采用CMS的支持向量机获得的AUC为92.4%。对不同编码方法的分析表明在进一步改进预测方面具有潜力。

相似文献

本文引用的文献

2
Role of unusual O-glycans in intercellular signaling.异常O-聚糖在细胞间信号传导中的作用。
Int J Biochem Cell Biol. 2009 May;41(5):1011-24. doi: 10.1016/j.biocel.2008.10.001. Epub 2008 Oct 8.
4
The Universal Protein Resource (UniProt) 2009.通用蛋白质资源(UniProt)2009 版
Nucleic Acids Res. 2009 Jan;37(Database issue):D169-74. doi: 10.1093/nar/gkn664. Epub 2008 Oct 4.
5
7
Characterization of site-specific N-glycosylation.位点特异性N-糖基化的表征
Methods Mol Biol. 2008;446:293-316. doi: 10.1007/978-1-60327-084-7_21.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验