• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

阿特拉斯——一个用于整合生物信息学的数据仓库。

Atlas - a data warehouse for integrative bioinformatics.

作者信息

Shah Sohrab P, Huang Yong, Xu Tao, Yuen Macaire M S, Ling John, Ouellette B F Francis

机构信息

UBC Bioinformatics Centre, University of British Columbia, Vancouver, BC, Canada.

出版信息

BMC Bioinformatics. 2005 Feb 21;6:34. doi: 10.1186/1471-2105-6-34.

DOI:10.1186/1471-2105-6-34
PMID:15723693
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC554782/
Abstract

BACKGROUND

We present a biological data warehouse called Atlas that locally stores and integrates biological sequences, molecular interactions, homology information, functional annotations of genes, and biological ontologies. The goal of the system is to provide data, as well as a software infrastructure for bioinformatics research and development.

DESCRIPTION

The Atlas system is based on relational data models that we developed for each of the source data types. Data stored within these relational models are managed through Structured Query Language (SQL) calls that are implemented in a set of Application Programming Interfaces (APIs). The APIs include three languages: C++, Java, and Perl. The methods in these API libraries are used to construct a set of loader applications, which parse and load the source datasets into the Atlas database, and a set of toolbox applications which facilitate data retrieval. Atlas stores and integrates local instances of GenBank, RefSeq, UniProt, Human Protein Reference Database (HPRD), Biomolecular Interaction Network Database (BIND), Database of Interacting Proteins (DIP), Molecular Interactions Database (MINT), IntAct, NCBI Taxonomy, Gene Ontology (GO), Online Mendelian Inheritance in Man (OMIM), LocusLink, Entrez Gene and HomoloGene. The retrieval APIs and toolbox applications are critical components that offer end-users flexible, easy, integrated access to this data. We present use cases that use Atlas to integrate these sources for genome annotation, inference of molecular interactions across species, and gene-disease associations.

CONCLUSION

The Atlas biological data warehouse serves as data infrastructure for bioinformatics research and development. It forms the backbone of the research activities in our laboratory and facilitates the integration of disparate, heterogeneous biological sources of data enabling new scientific inferences. Atlas achieves integration of diverse data sets at two levels. First, Atlas stores data of similar types using common data models, enforcing the relationships between data types. Second, integration is achieved through a combination of APIs, ontology, and tools. The Atlas software is freely available under the GNU General Public License at: http://bioinformatics.ubc.ca/atlas/

摘要

背景

我们展示了一个名为阿特拉斯(Atlas)的生物数据仓库,它在本地存储和整合生物序列、分子相互作用、同源性信息、基因功能注释以及生物本体论。该系统的目标是提供数据以及用于生物信息学研发的软件基础设施。

描述

阿特拉斯系统基于我们为每种源数据类型开发的关系数据模型。存储在这些关系模型中的数据通过在一组应用程序编程接口(API)中实现的结构化查询语言(SQL)调用进行管理。这些API包括三种语言:C++、Java和Perl。这些API库中的方法用于构建一组加载器应用程序,将源数据集解析并加载到阿特拉斯数据库中,以及一组便于数据检索的工具箱应用程序。阿特拉斯存储并整合了GenBank、RefSeq、UniProt、人类蛋白质参考数据库(HPRD)、生物分子相互作用网络数据库(BIND)、相互作用蛋白质数据库(DIP)、分子相互作用数据库(MINT)、IntAct、NCBI分类法、基因本体论(GO)、人类在线孟德尔遗传(OMIM)、基因座链接、Entrez基因和同源基因的本地实例。检索API和工具箱应用程序是关键组件,为最终用户提供了对这些数据灵活、便捷、集成的访问方式。我们展示了使用阿特拉斯整合这些源数据用于基因组注释、跨物种分子相互作用推断以及基因-疾病关联的用例。

结论

阿特拉斯生物数据仓库作为生物信息学研发的数据基础设施。它构成了我们实验室研究活动的支柱,并促进了不同的、异构的生物数据源的整合,从而实现新的科学推断。阿特拉斯在两个层面实现了不同数据集的整合。首先,阿特拉斯使用通用数据模型存储相似类型的数据,强化数据类型之间的关系。其次,通过API、本体论和工具的组合实现整合。阿特拉斯软件可根据GNU通用公共许可证在以下网址免费获取:http://bioinformatics.ubc.ca/atlas/

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/f485e186311f/1471-2105-6-34-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/5f9d4562f8df/1471-2105-6-34-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/ba457be74f8e/1471-2105-6-34-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/183502c4a71e/1471-2105-6-34-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/f485e186311f/1471-2105-6-34-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/5f9d4562f8df/1471-2105-6-34-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/ba457be74f8e/1471-2105-6-34-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/183502c4a71e/1471-2105-6-34-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0558/554782/f485e186311f/1471-2105-6-34-4.jpg

相似文献

1
Atlas - a data warehouse for integrative bioinformatics.阿特拉斯——一个用于整合生物信息学的数据仓库。
BMC Bioinformatics. 2005 Feb 21;6:34. doi: 10.1186/1471-2105-6-34.
2
BioWarehouse: a bioinformatics database warehouse toolkit.生物仓库:一个生物信息学数据库仓库工具包。
BMC Bioinformatics. 2006 Mar 23;7:170. doi: 10.1186/1471-2105-7-170.
3
GeneKeyDB: a lightweight, gene-centric, relational database to support data mining environments.基因密钥数据库:一个轻量级、以基因为中心的关系型数据库,用于支持数据挖掘环境。
BMC Bioinformatics. 2005 Mar 24;6:72. doi: 10.1186/1471-2105-6-72.
4
Critical evaluation of the JDO API for the persistence and portability requirements of complex biological databases.针对复杂生物数据库的持久性和可移植性需求对JDO API进行批判性评估。
BMC Bioinformatics. 2005 Jan 10;6:5. doi: 10.1186/1471-2105-6-5.
5
The Gene Set Builder: collation, curation, and distribution of sets of genes.基因集构建器:基因集的整理、管理与分发。
BMC Bioinformatics. 2005 Dec 21;6:305. doi: 10.1186/1471-2105-6-305.
6
GeneNotes--a novel information management software for biologists.基因笔记——一款面向生物学家的新型信息管理软件。
BMC Bioinformatics. 2005 Feb 1;6:20. doi: 10.1186/1471-2105-6-20.
7
BIAS: Bioinformatics Integrated Application Software.BIAS:生物信息学集成应用软件。
Bioinformatics. 2005 Apr 15;21(8):1745-6. doi: 10.1093/bioinformatics/bti170. Epub 2004 Nov 30.
8
Statistical Viewer: a tool to upload and integrate linkage and association data as plots displayed within the Ensembl genome browser.统计查看器:一种用于上传和整合连锁与关联数据并将其作为图谱显示在Ensembl基因组浏览器中的工具。
BMC Bioinformatics. 2005 Apr 12;6:95. doi: 10.1186/1471-2105-6-95.
9
CGKB: an annotation knowledge base for cowpea (Vigna unguiculata L.) methylation filtered genomic genespace sequences.CGKB:豇豆(Vigna unguiculata L.)甲基化过滤基因组基因空间序列的注释知识库。
BMC Bioinformatics. 2007 Apr 19;8:129. doi: 10.1186/1471-2105-8-129.
10
DAVID Knowledgebase: a gene-centered database integrating heterogeneous gene annotation resources to facilitate high-throughput gene functional analysis.大卫知识库:一个以基因为中心的数据库,整合了异构基因注释资源,以促进高通量基因功能分析。
BMC Bioinformatics. 2007 Nov 2;8:426. doi: 10.1186/1471-2105-8-426.

引用本文的文献

1
Sustainable software development in science - insights from 20 years of Vanted.科学领域的可持续软件开发——来自20年Vanted的见解。
J Integr Bioinform. 2025 Jul 1;22(1). doi: 10.1515/jib-2025-0007. eCollection 2025 Mar 1.
2
TAGOPSIN: collating taxa-specific gene and protein functional and structural information.TAGOPSIN:整理特定分类群的基因和蛋白质功能及结构信息。
BMC Bioinformatics. 2021 Oct 23;22(1):517. doi: 10.1186/s12859-021-04429-5.
3
Actionable digital phenotyping: a framework for the delivery of just-in-time and longitudinal interventions in clinical healthcare.

本文引用的文献

1
The wellcome trust sanger institute.惠康桑格研究所
Nurs Stand. 2015 Feb 3;29(22):30. doi: 10.7748/ns.29.22.30.s35.
2
Pegasys: software for executing and integrating analyses of biological sequences.派格萨斯:用于执行和整合生物序列分析的软件。
BMC Bioinformatics. 2004 Apr 19;5:40. doi: 10.1186/1471-2105-5-40.
3
The HUPO PSI's molecular interaction format--a community standard for the representation of protein interaction data.人类蛋白质组组织蛋白质组学标准倡议组织的分子相互作用格式——一种用于表示蛋白质相互作用数据的社区标准。
可操作的数字表型分析:临床医疗中即时和纵向干预的交付框架。
Mhealth. 2019 Aug 12;5:25. doi: 10.21037/mhealth.2019.07.04. eCollection 2019.
4
An online analytical processing multi-dimensional data warehouse for malaria data.用于疟疾数据的在线分析处理多维数据仓库。
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax073.
5
Decision support system for health care resources allocation.医疗保健资源分配决策支持系统
Electron Physician. 2017 Jun 25;9(6):4661-4668. doi: 10.19082/4661. eCollection 2017 Jun.
6
Identification of minimal eukaryotic introns through GeneBase, a user-friendly tool for parsing the NCBI Gene databank.通过GeneBase(一种用于解析NCBI基因数据库的用户友好型工具)鉴定最小真核内含子。
DNA Res. 2015 Dec;22(6):495-503. doi: 10.1093/dnares/dsv028. Epub 2015 Nov 17.
7
Clinical decision support systems for improving diagnostic accuracy and achieving precision medicine.用于提高诊断准确性和实现精准医疗的临床决策支持系统。
J Clin Bioinforma. 2015 Mar 26;5:4. doi: 10.1186/s13336-015-0019-3. eCollection 2015.
8
Semantic integration of gene expression analysis tools and data sources using software connectors.使用软件连接器实现基因表达分析工具和数据源的语义集成。
BMC Genomics. 2013 Oct 25;14 Suppl 6(Suppl 6):S2. doi: 10.1186/1471-2164-14-S6-S2.
9
SIDD: a semantically integrated database towards a global view of human disease.SIDD:一个语义集成的数据库,旨在提供人类疾病的全局视图。
PLoS One. 2013 Oct 11;8(10):e75504. doi: 10.1371/journal.pone.0075504. eCollection 2013.
10
JBioWH: an open-source Java framework for bioinformatics data integration.JBioWH:一个用于生物信息学数据集成的开源 Java 框架。
Database (Oxford). 2013 Jul 11;2013:bat051. doi: 10.1093/database/bat051. Print 2013.
Nat Biotechnol. 2004 Feb;22(2):177-83. doi: 10.1038/nbt926.
4
EnsMart: a generic system for fast and flexible access to biological data.EnsMart:一个用于快速灵活访问生物数据的通用系统。
Genome Res. 2004 Jan;14(1):160-9. doi: 10.1101/gr.1645104.
5
Human protein reference database as a discovery resource for proteomics.人类蛋白质参考数据库作为蛋白质组学的发现资源。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D497-501. doi: 10.1093/nar/gkh070.
6
IntAct: an open source molecular interaction database.IntAct:一个开源的分子相互作用数据库。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D452-5. doi: 10.1093/nar/gkh052.
7
The Database of Interacting Proteins: 2004 update.相互作用蛋白质数据库:2004年更新版。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D449-51. doi: 10.1093/nar/gkh086.
8
The Gene Ontology (GO) database and informatics resource.基因本体论(GO)数据库及信息资源。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D258-61. doi: 10.1093/nar/gkh036.
9
UniProt: the Universal Protein knowledgebase.通用蛋白质知识库(UniProt)。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D115-9. doi: 10.1093/nar/gkh131.
10
Database resources of the National Center for Biotechnology Information: update.美国国立生物技术信息中心的数据库资源:更新
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D35-40. doi: 10.1093/nar/gkh073.