基于特征融合的支持向量机分类器用于蛋白质亚细胞定位预测

Feature Fusion Based SVM Classifier for Protein Subcellular Localization Prediction.

作者信息

Rahman Julia, Mondal Md Nazrul Islam, Islam Md Khaled Ben, Hasan Md Al Mehedi

出版信息

J Integr Bioinform. 2016 Dec 18;13(1):288. doi: 10.2390/biecoll-jib-2016-288.

DOI:10.2390/biecoll-jib-2016-288

Abstract

For the importance of protein subcellular localization in different branches of life science and drug discovery, researchers have focused their attentions on protein subcellular localization prediction. Effective representation of features from protein sequences plays a most vital role in protein subcellular localization prediction specially in case of machine learning techniques. Single feature representation-like pseudo amino acid composition (PseAAC), physiochemical property models (PPM), and amino acid index distribution (AAID) contains insufficient information from protein sequences. To deal with such problems, we have proposed two feature fusion representations, AAIDPAAC and PPMPAAC, to work with Support Vector Machine classifiers, which fused PseAAC with PPM and AAID accordingly. We have evaluated the performance for both single and fused feature representation of a Gram-negative bacterial dataset. We have got at least 3% more actual accuracy by AAIDPAAC and 2% more locative accuracy by PPMPAAC than single feature representation.

摘要

鉴于蛋白质亚细胞定位在生命科学不同分支和药物发现中的重要性，研究人员已将注意力集中在蛋白质亚细胞定位预测上。在蛋白质亚细胞定位预测中，特别是在机器学习技术的情况下，从蛋白质序列中有效提取特征起着至关重要的作用。单一特征表示，如伪氨基酸组成（PseAAC）、物理化学性质模型（PPM）和氨基酸指数分布（AAID），包含的蛋白质序列信息不足。为了解决这些问题，我们提出了两种特征融合表示方法，即AAIDPAAC和PPMPAAC，并将其与支持向量机分类器配合使用，它们分别将PseAAC与PPM和AAID进行了融合。我们评估了革兰氏阴性细菌数据集的单一特征表示和融合特征表示的性能。与单一特征表示相比，AAIDPAAC的实际准确率至少提高了3%，PPMPAAC的定位准确率提高了2%。

相似文献

Feature Fusion Based SVM Classifier for Protein Subcellular Localization Prediction.

J Integr Bioinform. 2016 Dec 18;13(1):288. doi: 10.2390/biecoll-jib-2016-288.

Prediction of Protein Subcellular Localization Based on Fusion of Multi-view Features.

Molecules. 2019 Mar 6;24(5):919. doi: 10.3390/molecules24050919.

Predict Gram-Positive and Gram-Negative Subcellular Localization via Incorporating Evolutionary Information and Physicochemical Features Into Chou's General PseAAC.

IEEE Trans Nanobioscience. 2015 Dec;14(8):915-26. doi: 10.1109/TNB.2015.2500186. Epub 2015 Nov 12.

CE-PLoc: an ensemble classifier for predicting protein subcellular locations by fusing different modes of pseudo amino acid composition.

Comput Biol Chem. 2011 Aug 10;35(4):218-29. doi: 10.1016/j.compbiolchem.2011.05.003. Epub 2011 May 27.

Accurate prediction of multi-label protein subcellular localization through multi-view feature learning with RBRL classifier.

Brief Bioinform. 2021 Sep 2;22(5). doi: 10.1093/bib/bbab012.

Prediction of protein subcellular localization with oversampling approach and Chou's general PseAAC.

J Theor Biol. 2018 Jan 21;437:239-250. doi: 10.1016/j.jtbi.2017.10.030. Epub 2017 Oct 31.

A multiple information fusion method for predicting subcellular locations of two different types of bacterial protein simultaneously.

Biosystems. 2016 Jan;139:37-45. doi: 10.1016/j.biosystems.2015.12.002. Epub 2015 Dec 24.

Gram-positive and Gram-negative protein subcellular localization by incorporating evolutionary-based descriptors into Chou׳s general PseAAC.

J Theor Biol. 2015 Jan 7;364:284-94. doi: 10.1016/j.jtbi.2014.09.029. Epub 2014 Sep 28.

Feature extraction by statistical contact potentials and wavelet transform for predicting subcellular localizations in gram negative bacterial proteins.

J Theor Biol. 2015 Jan 7;364:121-30. doi: 10.1016/j.jtbi.2014.08.051. Epub 2014 Sep 16.

Protein subcellular localization prediction based on compartment-specific biological features.

Comput Syst Bioinformatics Conf. 2006:325-30.

引用本文的文献

Augmented sequence features and subcellular localization for functional characterization of unknown protein sequences.

Med Biol Eng Comput. 2021 Nov;59(11-12):2297-2310. doi: 10.1007/s11517-021-02436-5. Epub 2021 Sep 20.

A New Method for Recognizing Cytokines Based on Feature Combination and a Support Vector Machine Classifier.

Molecules. 2018 Aug 11;23(8):2008. doi: 10.3390/molecules23082008.

文献AI研究员

20分钟写一篇综述，助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型，支持多种主流文档格式。

立即体验

基于特征融合的支持向量机分类器用于蛋白质亚细胞定位预测

Feature Fusion Based SVM Classifier for Protein Subcellular Localization Prediction.

作者信息

Rahman Julia, Mondal Md Nazrul Islam, Islam Md Khaled Ben, Hasan Md Al Mehedi

出版信息

J Integr Bioinform. 2016 Dec 18;13(1):288. doi: 10.2390/biecoll-jib-2016-288.

DOI:10.2390/biecoll-jib-2016-288

PMID:28187424

Abstract

摘要

基于特征融合的支持向量机分类器用于蛋白质亚细胞定位预测

Feature Fusion Based SVM Classifier for Protein Subcellular Localization Prediction.

作者信息

出版信息

相似文献

引用本文的文献

文献AI研究员

用中文搜PubMed

文档翻译

Suppr 超能文献

基于特征融合的支持向量机分类器用于蛋白质亚细胞定位预测

Feature Fusion Based SVM Classifier for Protein Subcellular Localization Prediction.

作者信息

出版信息

相似文献

引用本文的文献