• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

黛西:一个综合的重复蛋白注释服务。

Daisy: An integrated repeat protein curation service.

机构信息

Department of Engineering, Pontifical Catholic University of Peru, Lima 32, Peru.

出版信息

J Struct Biol. 2023 Dec;215(4):108033. doi: 10.1016/j.jsb.2023.108033. Epub 2023 Oct 3.

DOI:10.1016/j.jsb.2023.108033
PMID:37797915
Abstract

Tandem repeats in proteins identification, classification and curation is a complex process that requires manual processing from experts, processing power and time. There are recent and relevant advances applying machine learning for protein structure prediction and repeat classification that are useful for this process. However, no service contemplates required databases and software to supplement researching on repeat proteins. In this publication we present Daisy, an integrated repeat protein curation web service. This service can process Protein Data Bank (PDB) and the AlphaFold Database entries for tandem repeats identification. In addition, it uses an algorithm to search a sequence against a library of Pfam hidden Markov model (HMM). Repeat classifications are associated with the identified families through RepeatsDB. This prediction is considered for enhancing the ReUPred algorithm execution and hastening the repeat units identification process. The service can also operate every associated PDB and AlphaFold structure with a UniProt proteome registry. Availability: The Daisy web service is freely accessible at daisy.bioinformatica.org.

摘要

蛋白质串联重复的鉴定、分类和注释是一个复杂的过程,需要专家进行人工处理,耗费大量的处理能力和时间。最近有一些相关的应用机器学习进行蛋白质结构预测和重复分类的进展,这对这个过程很有用。然而,目前没有服务考虑到需要的数据库和软件来补充重复蛋白质的研究。在本出版物中,我们介绍了 Daisy,这是一个集成的重复蛋白质注释网络服务。该服务可以处理蛋白质数据库 (PDB) 和 AlphaFold 数据库条目,以识别串联重复。此外,它还使用一种算法在 Pfam 隐马尔可夫模型 (HMM) 库中搜索序列。通过 RepeatsDB 将重复分类与鉴定的家族相关联。这一预测有助于增强 ReUPred 算法的执行,并加速重复单元的识别过程。该服务还可以对每个相关的 PDB 和 AlphaFold 结构与 UniProt 蛋白质组注册中心进行操作。可用性:Daisy 网络服务可在 daisy.bioinformatica.org 免费访问。

相似文献

1
Daisy: An integrated repeat protein curation service.黛西:一个综合的重复蛋白注释服务。
J Struct Biol. 2023 Dec;215(4):108033. doi: 10.1016/j.jsb.2023.108033. Epub 2023 Oct 3.
2
RepeatsDB 2.0: improved annotation, classification, search and visualization of repeat protein structures.RepeatsDB 2.0:改进了重复蛋白结构的注释、分类、搜索和可视化。
Nucleic Acids Res. 2017 Jan 4;45(D1):D308-D312. doi: 10.1093/nar/gkw1136. Epub 2016 Nov 29.
3
Identification of repetitive units in protein structures with ReUPred.使用ReUPred鉴定蛋白质结构中的重复单元。
Amino Acids. 2016 Jun;48(6):1391-400. doi: 10.1007/s00726-016-2187-2. Epub 2016 Feb 22.
4
DbStRiPs: Database of structural repeats in proteins.DbStRiPs:蛋白质结构重复数据库。
Protein Sci. 2022 Jan;31(1):23-36. doi: 10.1002/pro.4052. Epub 2021 Mar 6.
5
RepeatsDB in 2021: improved data and extended classification for protein tandem repeat structures.2021 年的 RepeatsDB:改进了蛋白质串联重复结构的数据并扩展了分类。
Nucleic Acids Res. 2021 Jan 8;49(D1):D452-D457. doi: 10.1093/nar/gkaa1097.
6
RepeatsDB-lite: a web server for unit annotation of tandem repeat proteins.RepeatsDB-lite:串联重复蛋白单位注释的网络服务器。
Nucleic Acids Res. 2018 Jul 2;46(W1):W402-W407. doi: 10.1093/nar/gky360.
7
RepeatsDB: a database of tandem repeat protein structures.RepeatsDB:串联重复蛋白结构数据库。
Nucleic Acids Res. 2014 Jan;42(Database issue):D352-7. doi: 10.1093/nar/gkt1175. Epub 2013 Dec 5.
8
Pfam: The protein families database in 2021.Pfam:2021 年的蛋白质家族数据库。
Nucleic Acids Res. 2021 Jan 8;49(D1):D412-D419. doi: 10.1093/nar/gkaa913.
9
Comparison of protein repeat classifications based on structure and sequence families.基于结构和序列家族的蛋白质重复分类比较。
Biochem Soc Trans. 2015 Oct;43(5):832-7. doi: 10.1042/BST20150079.
10
SSMap: a new UniProt-PDB mapping resource for the curation of structural-related information in the UniProt/Swiss-Prot Knowledgebase.SSMap:一种用于在UniProt/Swiss-Prot知识库中整理结构相关信息的新型UniProt-PDB映射资源。
BMC Bioinformatics. 2008 Sep 23;9:391. doi: 10.1186/1471-2105-9-391.