• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

哥伦巴:一个蛋白质、结构和注释的综合数据库。

Columba: an integrated database of proteins, structures, and annotations.

作者信息

Trissl Silke, Rother Kristian, Müller Heiko, Steinke Thomas, Koch Ina, Preissner Robert, Frömmel Cornelius, Leser Ulf

机构信息

Institute of Informatics, Humboldt-Universität zu Berlin, Unter den Linden 6, 10099 Berlin, Germany.

出版信息

BMC Bioinformatics. 2005 Mar 31;6:81. doi: 10.1186/1471-2105-6-81.

DOI:10.1186/1471-2105-6-81
PMID:15801979
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1087474/
Abstract

BACKGROUND

Structural and functional research often requires the computation of sets of protein structures based on certain properties of the proteins, such as sequence features, fold classification, or functional annotation. Compiling such sets using current web resources is tedious because the necessary data are spread over many different databases. To facilitate this task, we have created COLUMBA, an integrated database of annotations of protein structures.

DESCRIPTION

COLUMBA currently integrates twelve different databases, including PDB, KEGG, Swiss-Prot, CATH, SCOP, the Gene Ontology, and ENZYME. The database can be searched using either keyword search or data source-specific web forms. Users can thus quickly select and download PDB entries that, for instance, participate in a particular pathway, are classified as containing a certain CATH architecture, are annotated as having a certain molecular function in the Gene Ontology, and whose structures have a resolution under a defined threshold. The results of queries are provided in both machine-readable extensible markup language and human-readable format. The structures themselves can be viewed interactively on the web.

CONCLUSION

The COLUMBA database facilitates the creation of protein structure data sets for many structure-based studies. It allows to combine queries on a number of structure-related databases not covered by other projects at present. Thus, information on both many and few protein structures can be used efficiently. The web interface for COLUMBA is available at http://www.columba-db.de.

摘要

背景

结构和功能研究通常需要根据蛋白质的某些特性(如序列特征、折叠分类或功能注释)来计算蛋白质结构集。利用当前的网络资源编译此类集合很繁琐,因为必要的数据分散在许多不同的数据库中。为便于完成这项任务,我们创建了COLUMBA,一个蛋白质结构注释的综合数据库。

描述

COLUMBA目前整合了十二个不同的数据库,包括蛋白质数据银行(PDB)、京都基因与基因组百科全书(KEGG)、瑞士蛋白质数据库(Swiss-Prot)、蛋白质结构分类数据库(CATH)、蛋白质结构分类(SCOP)、基因本体论以及酶数据库(ENZYME)。该数据库可以使用关键词搜索或特定数据源的网络表单进行搜索。用户因此可以快速选择并下载例如参与特定途径、被分类为包含某种CATH结构、在基因本体论中被注释为具有某种分子功能且其结构分辨率在定义阈值以下的PDB条目。查询结果以机器可读的可扩展标记语言和人类可读格式提供。结构本身可以在网络上进行交互式查看。

结论

COLUMBA数据库便于为许多基于结构的研究创建蛋白质结构数据集。它允许对目前其他项目未涵盖的多个与结构相关的数据库进行联合查询。因此,可以有效地利用关于多种和少量蛋白质结构的信息。COLUMBA的网络界面可在http://www.columba-db.de获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/339dbecf655e/1471-2105-6-81-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/2f076d69d00e/1471-2105-6-81-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/94c8bfa37e05/1471-2105-6-81-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/b6e14b7dc943/1471-2105-6-81-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/339dbecf655e/1471-2105-6-81-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/2f076d69d00e/1471-2105-6-81-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/94c8bfa37e05/1471-2105-6-81-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/b6e14b7dc943/1471-2105-6-81-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/51e4/1087474/339dbecf655e/1471-2105-6-81-4.jpg

相似文献

1
Columba: an integrated database of proteins, structures, and annotations.哥伦巴:一个蛋白质、结构和注释的综合数据库。
BMC Bioinformatics. 2005 Mar 31;6:81. doi: 10.1186/1471-2105-6-81.
2
METIS: multiple extraction techniques for informative sentences.METIS:用于提取信息性句子的多种提取技术。
Bioinformatics. 2005 Nov 15;21(22):4196-7. doi: 10.1093/bioinformatics/bti675. Epub 2005 Sep 13.
3
Mapping PDB chains to UniProtKB entries.将蛋白质数据银行(PDB)链映射到通用蛋白质知识库(UniProtKB)条目。
Bioinformatics. 2005 Dec 1;21(23):4297-301. doi: 10.1093/bioinformatics/bti694. Epub 2005 Sep 27.
4
Atlas - a data warehouse for integrative bioinformatics.阿特拉斯——一个用于整合生物信息学的数据仓库。
BMC Bioinformatics. 2005 Feb 21;6:34. doi: 10.1186/1471-2105-6-34.
5
Seq2Struct: a resource for establishing sequence-structure links.Seq2Struct:一个用于建立序列-结构联系的资源。
Bioinformatics. 2005 Feb 15;21(4):551-3. doi: 10.1093/bioinformatics/bti049. Epub 2004 Sep 28.
6
CGKB: an annotation knowledge base for cowpea (Vigna unguiculata L.) methylation filtered genomic genespace sequences.CGKB:豇豆(Vigna unguiculata L.)甲基化过滤基因组基因空间序列的注释知识库。
BMC Bioinformatics. 2007 Apr 19;8:129. doi: 10.1186/1471-2105-8-129.
7
Construction of a nasopharyngeal carcinoma 2D/MS repository with Open Source XML database--Xindice.利用开源XML数据库——Xindice构建鼻咽癌二维/质谱数据库。
BMC Bioinformatics. 2006 Jan 11;7:13. doi: 10.1186/1471-2105-7-13.
8
WILMA-automated annotation of protein sequences.WILMA - 蛋白质序列的自动注释
Bioinformatics. 2004 Jan 1;20(1):127-8. doi: 10.1093/bioinformatics/btg380.
9
MannDB - a microbial database of automated protein sequence analyses and evidence integration for protein characterization.MannDB - 一个用于蛋白质表征的自动蛋白质序列分析和证据整合的微生物数据库。
BMC Bioinformatics. 2006 Oct 17;7:459. doi: 10.1186/1471-2105-7-459.
10
Glycosciences.DB: an annotated data collection linking glycomics and proteomics data (2018 update).糖科学数据库:连接糖组学和蛋白质组学数据的注释数据集(2018 更新)。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1195-D1201. doi: 10.1093/nar/gky994.

引用本文的文献

1
TAGOPSIN: collating taxa-specific gene and protein functional and structural information.TAGOPSIN:整理特定分类群的基因和蛋白质功能及结构信息。
BMC Bioinformatics. 2021 Oct 23;22(1):517. doi: 10.1186/s12859-021-04429-5.
2
Variant information systems for precision oncology.精准肿瘤学的变异信息系统。
BMC Med Inform Decis Mak. 2018 Nov 21;18(1):107. doi: 10.1186/s12911-018-0665-z.
3
An online analytical processing multi-dimensional data warehouse for malaria data.用于疟疾数据的在线分析处理多维数据仓库。

本文引用的文献

1
The iProClass integrated database for protein functional analysis.用于蛋白质功能分析的iProClass综合数据库。
Comput Biol Chem. 2004 Feb;28(1):87-96. doi: 10.1016/j.compbiolchem.2003.10.003.
2
PDBSprotEC: a Web-accessible database linking PDB chains to EC numbers via SwissProt.PDBSprotEC:一个通过SwissProt将蛋白质数据银行(PDB)链与酶委员会(EC)编号相链接的可网络访问数据库。
Bioinformatics. 2004 Apr 12;20(6):986-8. doi: 10.1093/bioinformatics/bth048. Epub 2004 Feb 5.
3
EnsMart: a generic system for fast and flexible access to biological data.
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax073.
4
Clinical decision support systems for improving diagnostic accuracy and achieving precision medicine.用于提高诊断准确性和实现精准医疗的临床决策支持系统。
J Clin Bioinforma. 2015 Mar 26;5:4. doi: 10.1186/s13336-015-0019-3. eCollection 2015.
5
RNA FRABASE 2.0: an advanced web-accessible database with the capacity to search the three-dimensional fragments within RNA structures.RNA FRABASE 2.0:一个高级的网络可访问数据库,具有搜索 RNA 结构中三维片段的能力。
BMC Bioinformatics. 2010 May 6;11:231. doi: 10.1186/1471-2105-11-231.
6
GenoQuery: a new querying module for functional annotation in a genomic warehouse.GenoQuery:基因组数据库中用于功能注释的新型查询模块。
Bioinformatics. 2008 Jul 1;24(13):i322-9. doi: 10.1093/bioinformatics/btn159.
7
BIOZON: a system for unification, management and analysis of heterogeneous biological data.生物地带:一个用于异构生物数据统一、管理和分析的系统。
BMC Bioinformatics. 2006 Feb 15;7:70. doi: 10.1186/1471-2105-7-70.
8
SuperMimic--fitting peptide mimetics into protein structures.超级模拟物——将肽模拟物嵌入蛋白质结构中。
BMC Bioinformatics. 2006 Jan 10;7:11. doi: 10.1186/1471-2105-7-11.
EnsMart:一个用于快速灵活访问生物数据的通用系统。
Genome Res. 2004 Jan;14(1):160-9. doi: 10.1101/gr.1645104.
4
The KEGG resource for deciphering the genome.用于解读基因组的KEGG资源。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D277-80. doi: 10.1093/nar/gkh063.
5
The Gene Ontology Annotation (GOA) Database: sharing knowledge in Uniprot with Gene Ontology.基因本体注释(GOA)数据库:在UniProt中与基因本体共享知识。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D262-6. doi: 10.1093/nar/gkh021.
6
The Gene Ontology (GO) database and informatics resource.基因本体论(GO)数据库及信息资源。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D258-61. doi: 10.1093/nar/gkh036.
7
Rationally selected basis proteins: a new approach to selecting proteins for spectroscopic secondary structure analysis.合理选择基础蛋白质:一种用于光谱二级结构分析的蛋白质选择新方法。
Protein Sci. 2003 Sep;12(9):2015-31. doi: 10.1110/ps.0354703.
8
PISCES: a protein sequence culling server.双鱼座:一个蛋白质序列筛选服务器。
Bioinformatics. 2003 Aug 12;19(12):1589-91. doi: 10.1093/bioinformatics/btg224.
9
E-MSD: the European Bioinformatics Institute Macromolecular Structure Database.E-MSD:欧洲生物信息学研究所大分子结构数据库。
Nucleic Acids Res. 2003 Jan 1;31(1):458-62. doi: 10.1093/nar/gkg065.
10
The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003.2003年的SWISS-PROT蛋白质知识库及其补充TrEMBL。
Nucleic Acids Res. 2003 Jan 1;31(1):365-70. doi: 10.1093/nar/gkg095.