• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于机器学习和基于相似度的方法的组合预测肽激素。

Prediction of peptide hormones using an ensemble of machine learning and similarity-based methods.

机构信息

Department of Computational Biology, Indraprastha Institute of Information Technology, New Delhi, India.

出版信息

Proteomics. 2024 Oct;24(20):e2400004. doi: 10.1002/pmic.202400004. Epub 2024 May 27.

DOI:10.1002/pmic.202400004
PMID:38803012
Abstract

Peptide hormones serve as genome-encoded signal transduction molecules that play essential roles in multicellular organisms, and their dysregulation can lead to various health problems. In this study, we propose a method for predicting hormonal peptides with high accuracy. The dataset used for training, testing, and evaluating our models consisted of 1174 hormonal and 1174 non-hormonal peptide sequences. Initially, we developed similarity-based methods utilizing BLAST and MERCI software. Although these similarity-based methods provided a high probability of correct prediction, they had limitations, such as no hits or prediction of limited sequences. To overcome these limitations, we further developed machine and deep learning-based models. Our logistic regression-based model achieved a maximum AUROC of 0.93 with an accuracy of 86% on an independent/validation dataset. To harness the power of similarity-based and machine learning-based models, we developed an ensemble method that achieved an AUROC of 0.96 with an accuracy of 89.79% and a Matthews correlation coefficient (MCC) of 0.8 on the validation set. To facilitate researchers in predicting and designing hormone peptides, we developed a web-based server called HOPPred. This server offers a unique feature that allows the identification of hormone-associated motifs within hormone peptides. The server can be accessed at: https://webs.iiitd.edu.in/raghava/hoppred/.

摘要

肽类激素作为基因组编码的信号转导分子,在多细胞生物中发挥着重要作用,它们的失调会导致各种健康问题。在这项研究中,我们提出了一种高精度预测激素肽的方法。用于训练、测试和评估我们模型的数据集由 1174 个激素肽和 1174 个非激素肽序列组成。最初,我们使用 BLAST 和 MERCI 软件开发了基于相似性的方法。虽然这些基于相似性的方法提供了正确预测的高概率,但它们也有局限性,例如没有命中或预测有限的序列。为了克服这些限制,我们进一步开发了基于机器和深度学习的模型。我们基于逻辑回归的模型在独立/验证数据集中达到了 0.93 的最大 AUROC 和 86%的准确率。为了利用基于相似性和机器学习的模型的优势,我们开发了一种集成方法,在验证集上达到了 0.96 的 AUROC、89.79%的准确率和 0.8 的马修斯相关系数(MCC)。为了方便研究人员预测和设计激素肽,我们开发了一个名为 HOPPred 的基于网络的服务器。该服务器提供了一个独特的功能,可以识别激素肽中的激素相关基序。该服务器可以在以下网址访问:https://webs.iiitd.edu.in/raghava/hoppred/。

相似文献

1
Prediction of peptide hormones using an ensemble of machine learning and similarity-based methods.基于机器学习和基于相似度的方法的组合预测肽激素。
Proteomics. 2024 Oct;24(20):e2400004. doi: 10.1002/pmic.202400004. Epub 2024 May 27.
2
ToxinPred 3.0: An improved method for predicting the toxicity of peptides.ToxinPred 3.0:一种改进的多肽毒性预测方法。
Comput Biol Med. 2024 Sep;179:108926. doi: 10.1016/j.compbiomed.2024.108926. Epub 2024 Jul 21.
3
ToxinPred2: an improved method for predicting toxicity of proteins.ToxinPred2:一种改进的蛋白质毒性预测方法。
Brief Bioinform. 2022 Sep 20;23(5). doi: 10.1093/bib/bbac174.
4
AlgPred 2.0: an improved method for predicting allergenic proteins and mapping of IgE epitopes.AlgPred 2.0:一种改进的过敏原蛋白预测方法和 IgE 表位作图。
Brief Bioinform. 2021 Jul 20;22(4). doi: 10.1093/bib/bbaa294.
5
Prediction of celiac disease associated epitopes and motifs in a protein.预测蛋白质中与乳糜泻相关的表位和基序。
Front Immunol. 2023 Jan 19;14:1056101. doi: 10.3389/fimmu.2023.1056101. eCollection 2023.
6
AntiCP 2.0: an updated model for predicting anticancer peptides.AntiCP 2.0:一种用于预测抗癌肽的更新模型。
Brief Bioinform. 2021 May 20;22(3). doi: 10.1093/bib/bbaa153.
7
A web server for predicting and scanning of IL-5 inducing peptides using alignment-free and alignment-based method.一个使用无比对和基于比对的方法预测和扫描白细胞介素-5诱导肽的网络服务器。
Comput Biol Med. 2023 May;158:106864. doi: 10.1016/j.compbiomed.2023.106864. Epub 2023 Apr 4.
8
DMPPred: a tool for identification of antigenic regions responsible for inducing type 1 diabetes mellitus.DMPPred:一种用于识别导致1型糖尿病的抗原区域的工具。
Brief Bioinform. 2023 Jan 19;24(1). doi: 10.1093/bib/bbac525.
9
A Hybrid Model for Predicting Pattern Recognition Receptors Using Evolutionary Information.一种利用进化信息预测模式识别受体的混合模型。
Front Immunol. 2020 Jan 30;11:71. doi: 10.3389/fimmu.2020.00071. eCollection 2020.
10
Prediction of Anti-Freezing Proteins From Their Evolutionary Profile.基于进化特征预测抗冻蛋白
Proteomics. 2025 Feb;25(3):e202400157. doi: 10.1002/pmic.202400157. Epub 2024 Sep 20.

引用本文的文献

1
Prediction of exosomal miRNA-based biomarkers for liquid biopsy.基于外泌体微小RNA的液体活检生物标志物预测
Sci Rep. 2025 Aug 25;15(1):31191. doi: 10.1038/s41598-025-15814-y.
2
Protein Sequence Analysis landscape: A Systematic Review of Task Types, Databases, Datasets, Word Embeddings Methods, and Language Models.蛋白质序列分析全景:任务类型、数据库、数据集、词嵌入方法和语言模型的系统综述
Database (Oxford). 2025 May 30;2025. doi: 10.1093/database/baaf027.
3
Understanding peptide hormones: from precursor proteins to bioactive molecules.
了解肽类激素:从前体蛋白到生物活性分子。
Trends Biochem Sci. 2025 Jun;50(6):481-494. doi: 10.1016/j.tibs.2025.03.014. Epub 2025 Apr 14.
4
A deep learning method for classification of HNSCC and HPV patients using single-cell transcriptomics.一种使用单细胞转录组学对头颈部鳞状细胞癌(HNSCC)和人乳头瘤病毒(HPV)患者进行分类的深度学习方法。
Front Mol Biosci. 2024 May 30;11:1395721. doi: 10.3389/fmolb.2024.1395721. eCollection 2024.