• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用比较基因组学发现新的子系统。

Discovering novel subsystems using comparative genomics.

机构信息

Artificial Intelligence Center, SRI International, Menlo Park, CA, USA.

出版信息

Bioinformatics. 2011 Sep 15;27(18):2478-85. doi: 10.1093/bioinformatics/btr428. Epub 2011 Jul 19.

DOI:10.1093/bioinformatics/btr428
PMID:21775308
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3167049/
Abstract

MOTIVATION

Key problems for computational genomics include discovering novel pathways in genome data, and discovering functional interaction partners for genes to define new members of partially elucidated pathways.

RESULTS

We propose a novel method for the discovery of subsystems from annotated genomes. For each gene pair, a score measuring the likelihood that the two genes belong to a same subsystem is computed using genome context methods. Genes are then grouped based on these scores, and the resulting groups are filtered to keep only high-confidence groups. Since the method is based on genome context analysis, it relies solely on structural annotation of the genomes. The method can be used to discover new pathways, find missing genes from a known pathway, find new protein complexes or other kinds of functional groups and assign function to genes. We tested the accuracy of our method in Escherichia coli K-12. In one configuration of the system, we find that 31.6% of the candidate groups generated by our method match a known pathway or protein complex closely, and that we rediscover 31.2% of all known pathways and protein complexes of at least 4 genes. We believe that a significant proportion of the candidates that do not match any known group in E.coli K-12 corresponds to novel subsystems that may represent promising leads for future laboratory research. We discuss in-depth examples of these findings.

AVAILABILITY

Predicted subsystems are available at http://brg.ai.sri.com/pwy-discovery/journal.html.

CONTACT

lferrer@ai.sri.com

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

计算基因组学的关键问题包括在基因组数据中发现新的途径,以及发现基因的功能相互作用伙伴,以定义部分阐明途径的新成员。

结果

我们提出了一种从注释基因组中发现子系统的新方法。对于每一对基因,使用基因组上下文方法计算测量这两个基因属于同一子系统的可能性的分数。然后根据这些分数对基因进行分组,并过滤得到的组以仅保留高置信度的组。由于该方法基于基因组上下文分析,因此仅依赖于基因组的结构注释。该方法可用于发现新途径,从已知途径中找到缺失的基因,发现新的蛋白质复合物或其他类型的功能群,并为基因赋予功能。我们在大肠杆菌 K-12 中测试了我们方法的准确性。在系统的一种配置中,我们发现我们的方法生成的 31.6%的候选组与已知途径或蛋白质复合物紧密匹配,并且我们重新发现了至少 4 个基因的所有已知途径和蛋白质复合物的 31.2%。我们相信,在大肠杆菌 K-12 中没有与任何已知组匹配的候选者的很大一部分对应于可能代表未来实验室研究有希望的线索的新子系统。我们深入讨论了这些发现的示例。

可用性

预测的子系统可在 http://brg.ai.sri.com/pwy-discovery/journal.html 上获得。

联系人

lferrer@ai.sri.com

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
Discovering novel subsystems using comparative genomics.利用比较基因组学发现新的子系统。
Bioinformatics. 2011 Sep 15;27(18):2478-85. doi: 10.1093/bioinformatics/btr428. Epub 2011 Jul 19.
2
Automatic detection of subsystem/pathway variants in genome analysis.基因组分析中自动检测子系统/通路变异
Bioinformatics. 2005 Jun;21 Suppl 1:i478-86. doi: 10.1093/bioinformatics/bti1052.
3
Towards dynamic genome-scale models.迈向动态的基因组规模模型。
Brief Bioinform. 2019 Jul 19;20(4):1167-1180. doi: 10.1093/bib/bbx096.
4
The Essential Genome of K-12.K-12 的必需基因组。
mBio. 2018 Feb 20;9(1):e02096-17. doi: 10.1128/mBio.02096-17.
5
High-throughput comparison, functional annotation, and metabolic modeling of plant genomes using the PlantSEED resource.利用 PlantSEED 资源进行高通量比较、功能注释和植物基因组代谢建模。
Proc Natl Acad Sci U S A. 2014 Jul 1;111(26):9645-50. doi: 10.1073/pnas.1401329111. Epub 2014 Jun 9.
6
Browsing metabolic and regulatory networks with BioCyc.使用BioCyc浏览代谢和调控网络。
Methods Mol Biol. 2012;804:197-216. doi: 10.1007/978-1-61779-361-5_11.
7
Using genomic sequencing for classical genetics in E. coli K12.利用基因组测序进行大肠杆菌 K12 的经典遗传学研究。
PLoS One. 2011 Feb 25;6(2):e16717. doi: 10.1371/journal.pone.0016717.
8
The EcoCyc Database.EcoCyc数据库。
EcoSal Plus. 2018 Nov;8(1). doi: 10.1128/ecosalplus.ESP-0006-2018.
9
Taxonomic weighting improves the accuracy of a gap-filling algorithm for metabolic models.分类加权提高了代谢模型填补空缺算法的准确性。
Bioinformatics. 2020 Mar 1;36(6):1823-1830. doi: 10.1093/bioinformatics/btz813.
10

引用本文的文献

1
Genome composition and phylogeny of microbes predict their co-occurrence in the environment.微生物的基因组组成和系统发育可预测它们在环境中的共生情况。
PLoS Comput Biol. 2017 Feb 2;13(2):e1005366. doi: 10.1371/journal.pcbi.1005366. eCollection 2017 Feb.
2
The MetaCyc database of metabolic pathways and enzymes and the BioCyc collection of pathway/genome databases.代谢途径与酶的MetaCyc数据库以及途径/基因组数据库的BioCyc集合。
Nucleic Acids Res. 2016 Jan 4;44(D1):D471-80. doi: 10.1093/nar/gkv1164. Epub 2015 Nov 2.
3
Finding sequences for over 270 orphan enzymes.找到超过270种孤儿酶的序列。
PLoS One. 2014 May 14;9(5):e97250. doi: 10.1371/journal.pone.0097250. eCollection 2014.

本文引用的文献

1
A systematic study of genome context methods: calibration, normalization and combination.基因组背景方法的系统研究:校准、归一化和组合。
BMC Bioinformatics. 2010 Oct 1;11:493. doi: 10.1186/1471-2105-11-493.
2
Machine learning methods for metabolic pathway prediction.机器学习方法在代谢途径预测中的应用。
BMC Bioinformatics. 2010 Jan 8;11:15. doi: 10.1186/1471-2105-11-15.
3
Pandora, a pathway and network discovery approach based on common biological evidence.基于常见生物证据的通路和网络发现方法——Pandora。
Bioinformatics. 2010 Feb 15;26(4):529-35. doi: 10.1093/bioinformatics/btp701. Epub 2009 Dec 22.
4
Fine-tuning of the ribosomal decoding center by conserved methyl-modifications in the Escherichia coli 16S rRNA.通过大肠杆菌 16S rRNA 中保守的甲基化修饰来精细调节核糖体解码中心。
Nucleic Acids Res. 2010 Mar;38(4):1341-52. doi: 10.1093/nar/gkp1073. Epub 2009 Dec 3.
5
EcoCyc: a comprehensive view of Escherichia coli biology.《大肠杆菌代谢数据库(EcoCyc):大肠杆菌生物学全景》
Nucleic Acids Res. 2009 Jan;37(Database issue):D464-70. doi: 10.1093/nar/gkn751. Epub 2008 Oct 30.
6
Mapping genetically compensatory pathways from synthetic lethal interactions in yeast.从酵母中的合成致死相互作用映射基因补偿途径。
PLoS One. 2008 Apr 9;3(4):e1922. doi: 10.1371/journal.pone.0001922.
7
The MetaCyc Database of metabolic pathways and enzymes and the BioCyc collection of Pathway/Genome Databases.代谢途径与酶的MetaCyc数据库以及途径/基因组数据库的BioCyc集合。
Nucleic Acids Res. 2008 Jan;36(Database issue):D623-31. doi: 10.1093/nar/gkm900. Epub 2007 Oct 27.
8
Mining biological networks for unknown pathways.挖掘生物网络以寻找未知途径。
Bioinformatics. 2007 Oct 15;23(20):2775-83. doi: 10.1093/bioinformatics/btm409. Epub 2007 Aug 30.
9
Using genome-context data to identify specific types of functional associations in pathway/genome databases.利用基因组上下文数据在通路/基因组数据库中识别特定类型的功能关联。
Bioinformatics. 2007 Jul 1;23(13):i205-11. doi: 10.1093/bioinformatics/btm213.
10
The outcomes of pathway database computations depend on pathway ontology.通路数据库计算的结果取决于通路本体论。
Nucleic Acids Res. 2006 Aug 7;34(13):3687-97. doi: 10.1093/nar/gkl438. Print 2006.