• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SLPred:一种用于多定位人类蛋白质的多视图亚细胞定位预测工具。

SLPred: a multi-view subcellular localization prediction tool for multi-location human proteins.

作者信息

Özsarı Gökhan, Rifaioglu Ahmet Sureyya, Atakan Ahmet, Doğan Tunca, Martin Maria Jesus, Çetin Atalay Rengül, Atalay Volkan

机构信息

Department of Computer Engineering, Middle East Technical University, Ankara 06800, Turkey.

Department of Computer Engineering, Niğde Ömer Halisdemir University, Niğde 51240, Turkey.

出版信息

Bioinformatics. 2022 Sep 2;38(17):4226-4229. doi: 10.1093/bioinformatics/btac458.

DOI:10.1093/bioinformatics/btac458
PMID:35801913
Abstract

SUMMARY

Accurate prediction of the subcellular locations (SLs) of proteins is a critical topic in protein science. In this study, we present SLPred, an ensemble-based multi-view and multi-label protein subcellular localization prediction tool. For a query protein sequence, SLPred provides predictions for nine main SLs using independent machine-learning models trained for each location. We used UniProtKB/Swiss-Prot human protein entries and their curated SL annotations as our source data. We connected all disjoint terms in the UniProt SL hierarchy based on the corresponding term relationships in the cellular component category of Gene Ontology and constructed a training dataset that is both reliable and large scale using the re-organized hierarchy. We tested SLPred on multiple benchmarking datasets including our-in house sets and compared its performance against six state-of-the-art methods. Results indicated that SLPred outperforms other tools in the majority of cases.

AVAILABILITY AND IMPLEMENTATION

SLPred is available both as an open-access and user-friendly web-server (https://slpred.kansil.org) and a stand-alone tool (https://github.com/kansil/SLPred). All datasets used in this study are also available at https://slpred.kansil.org.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

蛋白质亚细胞定位(SLs)的准确预测是蛋白质科学中的一个关键课题。在本研究中,我们提出了SLPred,一种基于集成的多视图和多标签蛋白质亚细胞定位预测工具。对于一个查询蛋白质序列,SLPred使用针对每个位置训练的独立机器学习模型,对九个主要的亚细胞定位进行预测。我们使用UniProtKB/Swiss-Prot人类蛋白质条目及其经过整理的亚细胞定位注释作为我们的源数据。我们根据基因本体论细胞成分类别中的相应术语关系,连接了UniProt亚细胞定位层次结构中所有不相交的术语,并使用重新组织的层次结构构建了一个既可靠又大规模的训练数据集。我们在包括我们内部数据集在内的多个基准数据集上测试了SLPred,并将其性能与六种最先进的方法进行了比较。结果表明,在大多数情况下,SLPred的性能优于其他工具。

可用性和实现方式

SLPred既可以作为一个开放访问且用户友好的网络服务器(https://slpred.kansil.org)使用,也可以作为一个独立工具(https://github.com/kansil/SLPred)使用。本研究中使用的所有数据集也可在https://slpred.kansil.org获取。

补充信息

补充数据可在《生物信息学》在线版获取。

相似文献

1
SLPred: a multi-view subcellular localization prediction tool for multi-location human proteins.SLPred:一种用于多定位人类蛋白质的多视图亚细胞定位预测工具。
Bioinformatics. 2022 Sep 2;38(17):4226-4229. doi: 10.1093/bioinformatics/btac458.
2
Hum-mPLoc 3.0: prediction enhancement of human protein subcellular localization through modeling the hidden correlations of gene ontology and functional domain features.Hum-mPLoc 3.0:通过对基因本体和功能域特征的隐藏相关性进行建模来增强人类蛋白质亚细胞定位预测
Bioinformatics. 2017 Mar 15;33(6):843-853. doi: 10.1093/bioinformatics/btw723.
3
UniProtKB/Swiss-Prot, the Manually Annotated Section of the UniProt KnowledgeBase: How to Use the Entry View.UniProtKB/Swiss-Prot,即UniProt知识库的人工注释部分:如何使用条目视图。
Methods Mol Biol. 2016;1374:23-54. doi: 10.1007/978-1-4939-3167-5_2.
4
pLoc-mHum: predict subcellular localization of multi-location human proteins via general PseAAC to winnow out the crucial GO information.pLoc-mHum:通过通用 PseAAC 预测多定位人类蛋白质的亚细胞定位,以筛选出关键的 GO 信息。
Bioinformatics. 2018 May 1;34(9):1448-1456. doi: 10.1093/bioinformatics/btx711.
5
pLoc_bal-mAnimal: predict subcellular localization of animal proteins by balancing training dataset and PseAAC.pLoc_bal-mAnimal:通过平衡训练数据集和 PseAAC 来预测动物蛋白质的亚细胞定位。
Bioinformatics. 2019 Feb 1;35(3):398-406. doi: 10.1093/bioinformatics/bty628.
6
UniProtKB/Swiss-Prot.通用蛋白质知识库/瑞士蛋白质数据库
Methods Mol Biol. 2007;406:89-112. doi: 10.1007/978-1-59745-535-0_4.
7
SubCons: a new ensemble method for improved human subcellular localization predictions.SubCons:一种用于改进人类亚细胞定位预测的新集成方法。
Bioinformatics. 2017 Aug 15;33(16):2464-2470. doi: 10.1093/bioinformatics/btx219.
8
HPSLPred: An Ensemble Multi-Label Classifier for Human Protein Subcellular Location Prediction with Imbalanced Source.HPSLPred:一种用于人类蛋白质亚细胞定位预测的集成多标签分类器,源数据不均衡。
Proteomics. 2017 Sep;17(17-18). doi: 10.1002/pmic.201700262.
9
Gene ontology based transfer learning for protein subcellular localization.基于基因本体论的蛋白质亚细胞定位迁移学习。
BMC Bioinformatics. 2011 Feb 2;12:44. doi: 10.1186/1471-2105-12-44.
10
ProFAB-open protein functional annotation benchmark.ProFAB-open 蛋白质功能注释基准测试。
Brief Bioinform. 2023 Mar 19;24(2). doi: 10.1093/bib/bbac627.

引用本文的文献

1
PScL-2LSAESM: bioimage-based prediction of protein subcellular localization by integrating heterogeneous features with the two-level SAE-SM and mean ensemble method.PScL-2LSAESM:基于生物图像的蛋白质亚细胞定位预测,通过整合异质特征与两级 SAE-SM 和均值集成方法。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac727.