• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

手动进行预测蛋白标记物的 GO 注释:GO 编纂中的 InterPro 方法。

Manual GO annotation of predictive protein signatures: the InterPro approach to GO curation.

机构信息

EMBL-EBI, The Wellcome Trust Genome Campus, Hinxton, Cambridgeshire CB10 1SD, UK.

出版信息

Database (Oxford). 2012 Feb 1;2012:bar068. doi: 10.1093/database/bar068. Print 2012.

DOI:10.1093/database/bar068
PMID:22301074
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3270475/
Abstract

InterPro amalgamates predictive protein signatures from a number of well-known partner databases into a single resource. To aid with interpretation of results, InterPro entries are manually annotated with terms from the Gene Ontology (GO). The InterPro2GO mappings are comprised of the cross-references between these two resources and are the largest source of GO annotation predictions for proteins. Here, we describe the protocol by which InterPro curators integrate GO terms into the InterPro database. We discuss the unique challenges involved in integrating specific GO terms with entries that may describe a diverse set of proteins, and we illustrate, with examples, how InterPro hierarchies reflect GO terms of increasing specificity. We describe a revised protocol for GO mapping that enables us to assign GO terms to domains based on the function of the individual domain, rather than the function of the families in which the domain is found. We also discuss how taxonomic constraints are dealt with and those cases where we are unable to add any appropriate GO terms. Expert manual annotation of InterPro entries with GO terms enables users to infer function, process or subcellular information for uncharacterized sequences based on sequence matches to predictive models. Database URL: http://www.ebi.ac.uk/interpro. The complete InterPro2GO mappings are available at: ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/external2go/interpro2go.

摘要

InterPro 将来自多个知名伙伴数据库的预测蛋白特征合并到一个单一资源中。为了帮助解释结果,InterPro 条目使用来自基因本体论(GO)的术语进行手动注释。InterPro2GO 映射由这两个资源之间的交叉引用组成,是蛋白质 GO 注释预测的最大来源。在这里,我们描述了 InterPro 管理员将 GO 术语整合到 InterPro 数据库中的协议。我们讨论了将特定的 GO 术语与可能描述一组多样化蛋白的条目进行整合所涉及的独特挑战,并通过示例说明 InterPro 层次结构如何反映越来越具体的 GO 术语。我们描述了一个修订后的 GO 映射协议,使我们能够根据单个域的功能而不是域所在家族的功能将 GO 术语分配给域。我们还讨论了如何处理分类约束以及在哪些情况下我们无法添加任何适当的 GO 术语。使用 GO 术语对 InterPro 条目进行专家手动注释,使用户能够根据与预测模型的序列匹配,推断未表征序列的功能、过程或亚细胞信息。数据库 URL:http://www.ebi.ac.uk/interpro。完整的 InterPro2GO 映射可在:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/external2go/interpro2go 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/3efd6d632756/bar068f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/95984e884503/bar068f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/87721a1fbf64/bar068f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/3efd6d632756/bar068f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/95984e884503/bar068f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/87721a1fbf64/bar068f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/925a/3270475/3efd6d632756/bar068f3.jpg

相似文献

1
Manual GO annotation of predictive protein signatures: the InterPro approach to GO curation.手动进行预测蛋白标记物的 GO 注释:GO 编纂中的 InterPro 方法。
Database (Oxford). 2012 Feb 1;2012:bar068. doi: 10.1093/database/bar068. Print 2012.
2
InterPro, progress and status in 2005.InterPro 2005年的进展与现状
Nucleic Acids Res. 2005 Jan 1;33(Database issue):D201-5. doi: 10.1093/nar/gki106.
3
The InterPro protein families and domains database: 20 years on.The InterPro 蛋白质家族和结构域数据库:20 年的发展历程。
Nucleic Acids Res. 2021 Jan 8;49(D1):D344-D354. doi: 10.1093/nar/gkaa977.
4
The InterPro protein families database: the classification resource after 15 years.InterPro蛋白质家族数据库:15年后的分类资源。
Nucleic Acids Res. 2015 Jan;43(Database issue):D213-21. doi: 10.1093/nar/gku1243. Epub 2014 Nov 26.
5
The InterPro Database, 2003 brings increased coverage and new features.2003年的InterPro数据库增加了覆盖范围并具备了新特性。
Nucleic Acids Res. 2003 Jan 1;31(1):315-8. doi: 10.1093/nar/gkg046.
6
An evaluation of GO annotation retrieval for BioCreAtIvE and GOA.对生物创意(BioCreAtIvE)和基因本体注释(GOA)的基因本体(GO)注释检索的评估。
BMC Bioinformatics. 2005;6 Suppl 1(Suppl 1):S17. doi: 10.1186/1471-2105-6-S1-S17. Epub 2005 May 24.
7
The Gene Ontology Annotation (GOA) project: implementation of GO in SWISS-PROT, TrEMBL, and InterPro.基因本体论注释(GOA)项目:基因本体论在SWISS-PROT、TrEMBL和InterPro中的实施。
Genome Res. 2003 Apr;13(4):662-72. doi: 10.1101/gr.461403. Epub 2003 Mar 12.
8
New developments in the InterPro database.InterPro数据库的新进展。
Nucleic Acids Res. 2007 Jan;35(Database issue):D224-8. doi: 10.1093/nar/gkl841.
9
The Gene Ontology Annotation (GOA) Database: sharing knowledge in Uniprot with Gene Ontology.基因本体注释(GOA)数据库:在UniProt中与基因本体共享知识。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D262-6. doi: 10.1093/nar/gkh021.
10
The InterPro database, an integrated documentation resource for protein families, domains and functional sites.InterPro数据库,一个关于蛋白质家族、结构域和功能位点的综合文献资源库。
Nucleic Acids Res. 2001 Jan 1;29(1):37-40. doi: 10.1093/nar/29.1.37.

引用本文的文献

1
Comparative genomics of reveals a conserved genome architecture and novel virulence-related gene clusters.[具体研究对象]的比较基因组学揭示了保守的基因组结构和新的毒力相关基因簇。 (因原文中“of”后缺少具体内容,故补充“[具体研究对象]”使译文完整通顺)
Microb Genom. 2025 Aug;11(8). doi: 10.1099/mgen.0.001477.
2
Genome-Wide Association Studies and Candidate Genes for Egg Production Traits in Layers from an F Crossbred Population Produced Using Two Divergently Selected Chicken Breeds, Russian White and Cornish White.利用两个经过不同方向选择的鸡品种俄罗斯白鸡和康沃尔白鸡培育的F代杂交群体中蛋鸡生产性状的全基因组关联研究及候选基因
Genes (Basel). 2025 May 15;16(5):583. doi: 10.3390/genes16050583.
3

本文引用的文献

1
InterPro in 2011: new developments in the family and domain prediction database.InterPro 在 2011 年:家族和域预测数据库的新发展。
Nucleic Acids Res. 2012 Jan;40(Database issue):D306-12. doi: 10.1093/nar/gkr948. Epub 2011 Nov 16.
2
UniProt Knowledgebase: a hub of integrated protein data.UniProt 知识库:一个集成蛋白质数据的中心。
Database (Oxford). 2011 Mar 29;2011:bar009. doi: 10.1093/database/bar009. Print 2011.
3
Identification and characterization of a bacterial glutamic peptidase.鉴定和表征一种细菌谷氨酸肽酶。
A compendium of human gene functions derived from evolutionary modelling.
基于进化建模得出的人类基因功能概要。
Nature. 2025 Apr;640(8057):146-154. doi: 10.1038/s41586-025-08592-0. Epub 2025 Feb 26.
4
Nano-Zinc Oxide Can Enhance the Tolerance of Apple Rootstock M9-T337 Seedlings to Saline Alkali Stress by Initiating a Variety of Physiological and Biochemical Pathways.纳米氧化锌可通过启动多种生理生化途径提高苹果砧木M9-T337幼苗对盐碱胁迫的耐受性。
Plants (Basel). 2025 Jan 15;14(2):233. doi: 10.3390/plants14020233.
5
Unravelling distinct patterns of metagenomic surveillance and respiratory microbiota between two P1 genotypes of .揭示两种P1基因型之间宏基因组监测和呼吸道微生物群的不同模式。 (注:原文句末不完整,推测补充完整后可能是这样的翻译)
Emerg Microbes Infect. 2025 Dec;14(1):2449087. doi: 10.1080/22221751.2024.2449087. Epub 2025 Jan 13.
6
InterPro: the protein sequence classification resource in 2025.InterPro:2025年的蛋白质序列分类资源。
Nucleic Acids Res. 2025 Jan 6;53(D1):D444-D456. doi: 10.1093/nar/gkae1082.
7
CRISPR/dCas9-Mediated DNA Methylation Editing on in Chinese Tongue Sole () Testis Cells.CRISPR/dCas9 介导的中国舌鳎()睾丸细胞中 DNA 甲基化编辑。
Int J Mol Sci. 2024 Jul 11;25(14):7637. doi: 10.3390/ijms25147637.
8
Mutual annotation-based prediction of protein domain functions with Domain2GO.基于互注释的蛋白质结构域功能预测与 Domain2GO。
Protein Sci. 2024 Jun;33(6):e4988. doi: 10.1002/pro.4988.
9
Phylogenomic profiles of whole-genome duplications in Poaceae and landscape of differential duplicate retention and losses among major Poaceae lineages.禾本科全基因组加倍的系统基因组特征及主要禾本科谱系中差异重复保留和丢失的景观。
Nat Commun. 2024 Apr 17;15(1):3305. doi: 10.1038/s41467-024-47428-9.
10
Genetic diversity and candidate genes for transient waterlogging tolerance in mungbean at the germination and seedling stages.绿豆发芽期和幼苗期对短暂渍水耐受性的遗传多样性及候选基因
Front Plant Sci. 2024 Mar 21;15:1297096. doi: 10.3389/fpls.2024.1297096. eCollection 2024.
BMC Biochem. 2010 Dec 1;11:47. doi: 10.1186/1471-2091-11-47.
4
Formalization of taxon-based constraints to detect inconsistencies in annotation and ontology development.基于分类群的约束形式化,以检测注释和本体开发中的不一致性。
BMC Bioinformatics. 2010 Oct 25;11:530. doi: 10.1186/1471-2105-11-530.
5
A practical, bioinformatic workflow system for large data sets generated by next-generation sequencing.一种用于处理由下一代测序产生的大数据集的实用生物信息工作流程系统。
Nucleic Acids Res. 2010 Sep;38(17):e171. doi: 10.1093/nar/gkq667. Epub 2010 Aug 3.
6
PANTHER version 7: improved phylogenetic trees, orthologs and collaboration with the Gene Ontology Consortium.PANTHER 版本 7:改进了系统发育树、直系同源物,以及与基因本体论联盟的合作。
Nucleic Acids Res. 2010 Jan;38(Database issue):D204-10. doi: 10.1093/nar/gkp1019. Epub 2009 Dec 16.
7
The Gene Ontology's Reference Genome Project: a unified framework for functional annotation across species.基因本体论参考基因组计划:跨物种功能注释的统一框架。
PLoS Comput Biol. 2009 Jul;5(7):e1000431. doi: 10.1371/journal.pcbi.1000431. Epub 2009 Jul 3.
8
Blinded by the Light: The Growing Complexity of p53.被光蒙蔽:p53日益复杂的情况
Cell. 2009 May 1;137(3):413-31. doi: 10.1016/j.cell.2009.04.037.
9
The GOA database in 2009--an integrated Gene Ontology Annotation resource.2009年的基因本体注释(GOA)数据库——一个整合的基因本体注释资源。
Nucleic Acids Res. 2009 Jan;37(Database issue):D396-403. doi: 10.1093/nar/gkn803. Epub 2008 Oct 27.
10
HAMAP: a database of completely sequenced microbial proteome sets and manually curated microbial protein families in UniProtKB/Swiss-Prot.HAMAP:一个包含完全测序的微生物蛋白质组集以及UniProtKB/Swiss-Prot中经人工整理的微生物蛋白质家族的数据库。
Nucleic Acids Res. 2009 Jan;37(Database issue):D471-8. doi: 10.1093/nar/gkn661. Epub 2008 Oct 11.