• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

DeepLoc 2.1:使用蛋白质语言模型进行多标签膜蛋白类型预测。

DeepLoc 2.1: multi-label membrane protein type prediction using protein language models.

机构信息

Section for Bioinformatics, Department of Health Technology, Technical University of Denmark, 2800 Kongens Lyngby, Denmark.

Bioinformatics Centre, Department of Biology, University of Copenhagen, 2200 Copenhagen, Denmark.

出版信息

Nucleic Acids Res. 2024 Jul 5;52(W1):W215-W220. doi: 10.1093/nar/gkae237.

DOI:10.1093/nar/gkae237
PMID:38587188
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11223819/
Abstract

DeepLoc 2.0 is a popular web server for the prediction of protein subcellular localization and sorting signals. Here, we introduce DeepLoc 2.1, which additionally classifies the input proteins into the membrane protein types Transmembrane, Peripheral, Lipid-anchored and Soluble. Leveraging pre-trained transformer-based protein language models, the server utilizes a three-stage architecture for sequence-based, multi-label predictions. Comparative evaluations with other established tools on a test set of 4933 eukaryotic protein sequences, constructed following stringent homology partitioning, demonstrate state-of-the-art performance. Notably, DeepLoc 2.1 outperforms existing models, with the larger ProtT5 model exhibiting a marginal advantage over the ESM-1B model. The web server is available at https://services.healthtech.dtu.dk/services/DeepLoc-2.1.

摘要

DeepLoc 2.0 是一个用于预测蛋白质亚细胞定位和分拣信号的流行网络服务器。在这里,我们介绍 DeepLoc 2.1,它还可以将输入的蛋白质分类为膜蛋白类型:跨膜、外周、脂锚定和可溶性。该服务器利用基于预训练的转换器的蛋白质语言模型,采用基于序列的三阶段架构进行多标签预测。在一个经过严格同源分区构建的 4933 个真核蛋白质序列测试集上,与其他已建立的工具进行的比较评估表明,该服务器具有最先进的性能。值得注意的是,DeepLoc 2.1 优于现有的模型,较大的 ProtT5 模型比 ESM-1B 模型表现出略微的优势。该网络服务器可在 https://services.healthtech.dtu.dk/services/DeepLoc-2.1 上获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f549/11223819/61618a5ab260/gkae237fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f549/11223819/6818fd6766a7/gkae237figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f549/11223819/61618a5ab260/gkae237fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f549/11223819/6818fd6766a7/gkae237figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f549/11223819/61618a5ab260/gkae237fig1.jpg

相似文献

1
DeepLoc 2.1: multi-label membrane protein type prediction using protein language models.DeepLoc 2.1:使用蛋白质语言模型进行多标签膜蛋白类型预测。
Nucleic Acids Res. 2024 Jul 5;52(W1):W215-W220. doi: 10.1093/nar/gkae237.
2
DeepLoc 2.0: multi-label subcellular localization prediction using protein language models.DeepLoc 2.0:使用蛋白质语言模型进行多标签亚细胞定位预测。
Nucleic Acids Res. 2022 Jul 5;50(W1):W228-W234. doi: 10.1093/nar/gkac278.
3
DeepLoc: prediction of protein subcellular localization using deep learning.DeepLoc:使用深度学习进行蛋白质亚细胞定位预测。
Bioinformatics. 2017 Nov 1;33(21):3387-3395. doi: 10.1093/bioinformatics/btx431.
4
SignalP: The Evolution of a Web Server.SignalP:一个网络服务器的发展历程。
Methods Mol Biol. 2024;2836:331-367. doi: 10.1007/978-1-0716-4007-4_17.
5
The TOPCONS web server for consensus prediction of membrane protein topology and signal peptides.用于膜蛋白拓扑结构和信号肽一致性预测的TOPCONS网络服务器。
Nucleic Acids Res. 2015 Jul 1;43(W1):W401-7. doi: 10.1093/nar/gkv485. Epub 2015 May 12.
6
PROTEUS2: a web server for comprehensive protein structure prediction and structure-based annotation.PROTEUS2:一个用于全面蛋白质结构预测和基于结构的注释的网络服务器。
Nucleic Acids Res. 2008 Jul 1;36(Web Server issue):W202-9. doi: 10.1093/nar/gkn255. Epub 2008 May 15.
7
TRAMPLE: the transmembrane protein labelling environment.TRAMPLE:跨膜蛋白标记环境。
Nucleic Acids Res. 2005 Jul 1;33(Web Server issue):W198-201. doi: 10.1093/nar/gki440.
8
TMpro web server and web service: transmembrane helix prediction through amino acid property analysis.TMpro网络服务器和网络服务:通过氨基酸特性分析进行跨膜螺旋预测。
Bioinformatics. 2007 Oct 15;23(20):2795-6. doi: 10.1093/bioinformatics/btm398. Epub 2007 Aug 27.
9
MemType-2L: a web server for predicting membrane proteins and their types by incorporating evolution information through Pse-PSSM.MemType-2L:一个通过伪位置特异性得分矩阵整合进化信息来预测膜蛋白及其类型的网络服务器。
Biochem Biophys Res Commun. 2007 Aug 24;360(2):339-45. doi: 10.1016/j.bbrc.2007.06.027. Epub 2007 Jun 15.
10
Advantages of combined transmembrane topology and signal peptide prediction--the Phobius web server.跨膜拓扑结构与信号肽联合预测的优势——Phobius网络服务器
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W429-32. doi: 10.1093/nar/gkm256. Epub 2007 May 5.

引用本文的文献

1
Naturally impaired side-chain shortening of aromatic 3-ketoacyl-CoAs reveals the biosynthetic pathway of plant acetophenones.天然存在的芳香族3-酮酰基辅酶A侧链缩短受损揭示了植物苯乙酮的生物合成途径。
Nat Plants. 2025 Sep 5. doi: 10.1038/s41477-025-02082-x.
2
Soybean Cyst Nematode-Resistant Protein AAT Affects Amino Acid Homeostasis and Betalain Accumulation.抗大豆胞囊线虫蛋白AAT影响氨基酸稳态和甜菜碱积累。
Plant Direct. 2025 Aug 26;9(8):e70098. doi: 10.1002/pld3.70098. eCollection 2025 Aug.
3
On the impact of local protein structure features on prediction of major histocompatibility complex class I and II antigen presentation.

本文引用的文献

1
GraphPart: homology partitioning for biological sequence analysis.GraphPart:用于生物序列分析的同源性划分
NAR Genom Bioinform. 2023 Oct 16;5(4):lqad088. doi: 10.1093/nargab/lqad088. eCollection 2023 Dec.
2
Evolutionary-scale prediction of atomic-level protein structure with a language model.用语言模型进行原子级蛋白质结构的进化尺度预测。
Science. 2023 Mar 17;379(6637):1123-1130. doi: 10.1126/science.ade2574. Epub 2023 Mar 16.
3
UniProt: the Universal Protein Knowledgebase in 2023.UniProt:2023 年的通用蛋白质知识库。
局部蛋白质结构特征对主要组织相容性复合体I类和II类抗原呈递预测的影响
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf402.
4
Immunoinformatic design of chimeric multiepitope vaccine for the prevention of human metapneumovirus (hMPV).用于预防人偏肺病毒(hMPV)的嵌合多表位疫苗的免疫信息学设计
BMC Infect Dis. 2025 Jul 30;25(1):964. doi: 10.1186/s12879-025-11339-x.
5
Patchy Phylogenetic Distribution and Poor Translational Adaptation of a Nested ORF in the Mammalian Mitochondrial Gene.哺乳动物线粒体基因中一个嵌套开放阅读框的斑驳系统发育分布及较差的翻译适应性
Genes (Basel). 2025 Jul 17;16(7):833. doi: 10.3390/genes16070833.
6
Comparative Quantitative Proteomic Analysis of High and Low Toxin-Producing Strains Reveals Differences in Polyketide Synthase Abundance and Redox Status of the Proteome.高产毒与低产毒菌株的比较定量蛋白质组学分析揭示聚酮合酶丰度和蛋白质组氧化还原状态的差异
Mar Drugs. 2025 Jul 17;23(7):291. doi: 10.3390/md23070291.
7
Enrichable cross-linkers for mapping direct protein interactions.用于绘制直接蛋白质相互作用图谱的可富集交联剂。
Genome Biol. 2025 Jul 15;26(1):205. doi: 10.1186/s13059-025-03669-5.
8
Comparative Genomics of Chloropicon primus and Chloropicon roscoffensis Provide Insights into the Evolutionary Dynamics and Ecological Success of These Tiny Green Algae in Marine Environments.绿皮藻属原始种和罗斯科夫绿皮藻属的比较基因组学研究为这些微小绿藻在海洋环境中的进化动态和生态成功提供了见解。
Genome Biol Evol. 2025 Jul 3;17(7). doi: 10.1093/gbe/evaf140.
9
Practical Applications of Language Models in Protein Sorting Prediction: SignalP 6.0, DeepLoc 2.1, and DeepLocPro 1.0.语言模型在蛋白质分选预测中的实际应用:SignalP 6.0、DeepLoc 2.1和DeepLocPro 1.0
Methods Mol Biol. 2025;2941:153-175. doi: 10.1007/978-1-0716-4623-6_10.
10
Functional Characterization of Squalene Epoxidases from .来自……的角鲨烯环氧酶的功能表征
Plants (Basel). 2025 Jun 6;14(12):1740. doi: 10.3390/plants14121740.
Nucleic Acids Res. 2023 Jan 6;51(D1):D523-D531. doi: 10.1093/nar/gkac1052.
4
DeepLoc 2.0: multi-label subcellular localization prediction using protein language models.DeepLoc 2.0:使用蛋白质语言模型进行多标签亚细胞定位预测。
Nucleic Acids Res. 2022 Jul 5;50(W1):W228-W234. doi: 10.1093/nar/gkac278.
5
SignalP 6.0 predicts all five types of signal peptides using protein language models.SignalP 6.0 使用蛋白质语言模型预测所有五种类型的信号肽。
Nat Biotechnol. 2022 Jul;40(7):1023-1025. doi: 10.1038/s41587-021-01156-3. Epub 2022 Jan 3.
6
ProtTrans: Toward Understanding the Language of Life Through Self-Supervised Learning.ProtTrans:通过自监督学习理解生命语言。
IEEE Trans Pattern Anal Mach Intell. 2022 Oct;44(10):7112-7127. doi: 10.1109/TPAMI.2021.3095381. Epub 2022 Sep 14.
7
Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences.生物结构和功能源于将无监督学习扩展到 2.5 亿个蛋白质序列。
Proc Natl Acad Sci U S A. 2021 Apr 13;118(15). doi: 10.1073/pnas.2016239118.
8
The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation.马修斯相关系数(MCC)在二分类评估中优于 F1 得分和准确率的优势。
BMC Genomics. 2020 Jan 2;21(1):6. doi: 10.1186/s12864-019-6413-7.
9
Detecting sequence signals in targeting peptides using deep learning.利用深度学习检测靶向肽中的序列信号。
Life Sci Alliance. 2019 Sep 30;2(5). doi: 10.26508/lsa.201900429. Print 2019 Oct.
10
Focal Loss for Dense Object Detection.用于密集目标检测的焦散损失
IEEE Trans Pattern Anal Mach Intell. 2020 Feb;42(2):318-327. doi: 10.1109/TPAMI.2018.2858826. Epub 2018 Jul 23.