• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CoGenT++:一个用于计算基因组学的广泛且可扩展的数据环境。

CoGenT++: an extensive and extensible data environment for computational genomics.

作者信息

Goldovsky Leon, Janssen Paul, Ahrén Dag, Audit Benjamin, Cases Ildefonso, Darzentas Nikos, Enright Anton J, López-Bigas Núria, Peregrin-Alvarez José M, Smith Mike, Tsoka Sophia, Kunin Victor, Ouzounis Christos A

机构信息

Computational Genomics Group, The European Bioinformatics Institute EMBL, Cambridge Outstation, Cambridge CB10 1SD, UK.

出版信息

Bioinformatics. 2005 Oct 1;21(19):3806-10. doi: 10.1093/bioinformatics/bti579.

DOI:10.1093/bioinformatics/bti579
PMID:16216832
Abstract

MOTIVATION

CoGenT++ is a data environment for computational research in comparative and functional genomics, designed to address issues of consistency, reproducibility, scalability and accessibility.

DESCRIPTION

CoGenT++ facilitates the re-distribution of all fully sequenced and published genomes, storing information about species, gene names and protein sequences. We describe our scalable implementation of ProXSim, a continually updated all-against-all similarity database, which stores pairwise relationships between all genome sequences. Based on these similarities, derived databases are generated for gene fusions--AllFuse, putative orthologs--OFAM, protein families--TRIBES, phylogenetic profiles--ProfUse and phylogenetic trees. Extensions based on the CoGenT++ environment include disease gene prediction, pattern discovery, automated domain detection, genome annotation and ancestral reconstruction.

CONCLUSION

CoGenT++ provides a comprehensive environment for computational genomics, accessible primarily for large-scale analyses as well as manual browsing.

摘要

动机

CoGenT++是一个用于比较和功能基因组学计算研究的数据环境,旨在解决一致性、可重复性、可扩展性和可访问性问题。

描述

CoGenT++促进所有已完全测序和发表的基因组的重新分发,存储有关物种、基因名称和蛋白质序列的信息。我们描述了ProXSim的可扩展实现,这是一个不断更新的全基因组比对相似性数据库,它存储所有基因组序列之间的成对关系。基于这些相似性,生成了用于基因融合的衍生数据库——AllFuse、假定的直系同源基因——OFAM、蛋白质家族——TRIBES、系统发育谱——ProfUse和系统发育树。基于CoGenT++环境的扩展包括疾病基因预测、模式发现、自动结构域检测、基因组注释和祖先重建。

结论

CoGenT++为计算基因组学提供了一个全面的环境,主要可用于大规模分析以及手动浏览。

相似文献

1
CoGenT++: an extensive and extensible data environment for computational genomics.CoGenT++:一个用于计算基因组学的广泛且可扩展的数据环境。
Bioinformatics. 2005 Oct 1;21(19):3806-10. doi: 10.1093/bioinformatics/bti579.
2
PLATCOM: a Platform for Computational Comparative Genomics.PLATCOM:一个用于计算比较基因组学的平台。
Bioinformatics. 2005 May 15;21(10):2514-6. doi: 10.1093/bioinformatics/bti350. Epub 2005 Feb 24.
3
Lightweight genome viewer: portable software for browsing genomics data in its chromosomal context.轻量级基因组浏览器:用于在染色体背景下浏览基因组数据的便携式软件。
BMC Bioinformatics. 2007 Sep 18;8:344. doi: 10.1186/1471-2105-8-344.
4
MaGe: a microbial genome annotation system supported by synteny results.MaGe:一个由共线性结果支持的微生物基因组注释系统。
Nucleic Acids Res. 2006 Jan 10;34(1):53-65. doi: 10.1093/nar/gkj406. Print 2006.
5
A hybrid computational grid architecture for comparative genomics.一种用于比较基因组学的混合计算网格架构。
IEEE Trans Inf Technol Biomed. 2008 Mar;12(2):218-25. doi: 10.1109/TITB.2007.908462.
6
MILANO--custom annotation of microarray results using automatic literature searches.米兰——使用自动文献检索对微阵列结果进行定制注释。
BMC Bioinformatics. 2005 Jan 20;6:12. doi: 10.1186/1471-2105-6-12.
7
ROSY--a flexible and universal database and bioinformatics tool platform for Roseobacter related species.ROSY——一个用于玫瑰杆菌相关物种的灵活通用数据库和生物信息学工具平台。
In Silico Biol. 2008;8(2):177-86.
8
An agent- and ontology-based system for integrating public gene, protein, and disease databases.一种基于代理和本体的用于整合公共基因、蛋白质和疾病数据库的系统。
J Biomed Inform. 2007 Feb;40(1):17-29. doi: 10.1016/j.jbi.2006.02.014. Epub 2006 Mar 20.
9
MANTIS: a phylogenetic framework for multi-species genome comparisons.螳螂:多物种基因组比较的系统发育框架。
Bioinformatics. 2008 Jan 15;24(2):151-7. doi: 10.1093/bioinformatics/btm567. Epub 2007 Nov 19.
10
Windows .NET Network Distributed Basic Local Alignment Search Toolkit (W.ND-BLAST).Windows .NET网络分布式基本局部比对搜索工具包(W.ND-BLAST)。
BMC Bioinformatics. 2005 Apr 8;6:93. doi: 10.1186/1471-2105-6-93.

引用本文的文献

1
CGG toolkit: Software components for computational genomics.CGG 工具包:计算基因组学的软件组件。
PLoS Comput Biol. 2023 Nov 7;19(11):e1011498. doi: 10.1371/journal.pcbi.1011498. eCollection 2023 Nov.
2
Ancestral state reconstruction of metabolic pathways across pangenome ensembles.泛基因组集合中代谢途径的祖先状态重建。
Microb Genom. 2020 Nov;6(11). doi: 10.1099/mgen.0.000429.
3
HipMCL: a high-performance parallel implementation of the Markov clustering algorithm for large-scale networks.HipMCL:一种用于大规模网络的马尔可夫聚类算法的高性能并行实现。
Nucleic Acids Res. 2018 Apr 6;46(6):e33. doi: 10.1093/nar/gkx1313.
4
Data integration in biological research: an overview.生物学研究中的数据整合:概述
J Biol Res (Thessalon). 2015 Sep 2;22(1):9. doi: 10.1186/s40709-015-0032-5. eCollection 2015 Dec.
5
The chlamydiales pangenome revisited: structural stability and functional coherence.再探衣原体目泛基因组:结构稳定性与功能一致性。
Genes (Basel). 2012 May 16;3(2):291-319. doi: 10.3390/genes3020291.
6
Detection of genomic idiosyncrasies using fuzzy phylogenetic profiles.使用模糊系统发育轮廓检测基因组特征。
PLoS One. 2013;8(1):e52854. doi: 10.1371/journal.pone.0052854. Epub 2013 Jan 14.
7
Protein coalitions in a core mammalian biochemical network linked by rapidly evolving proteins.核心哺乳动物生化网络中的蛋白质联盟,由快速进化的蛋白质连接。
BMC Evol Biol. 2011 May 25;11:142. doi: 10.1186/1471-2148-11-142.
8
On the artefactual parasitic eubacteria clan in conditioned logdet phylogenies: heterotachy and ortholog identification artefacts as explanations.条件 logdet 系统发育中人为寄生真细菌类群:作为解释的异时性和直系同源鉴定人为产物。
BMC Evol Biol. 2010 Nov 9;10:343. doi: 10.1186/1471-2148-10-343.
9
Stratification of co-evolving genomic groups using ranked phylogenetic profiles.基于排序系统发育轮廓对共同进化基因组群组进行分层。
BMC Bioinformatics. 2009 Oct 27;10:355. doi: 10.1186/1471-2105-10-355.
10
The Modular Organization of Protein Interactions in Escherichia coli.大肠杆菌中蛋白质相互作用的模块化组织
PLoS Comput Biol. 2009 Oct;5(10):e1000523. doi: 10.1371/journal.pcbi.1000523. Epub 2009 Oct 2.