• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用概率主题模型推断蛋白质家族的功能模块。

Inferring functional modules of protein families with probabilistic topic models.

机构信息

Max Planck Research Group for Computational Genomics and Epidemiology, Max Planck Institute for Informatics, University Campus E1 4, 66123 Saarbrücken, Germany.

出版信息

BMC Bioinformatics. 2011 May 9;12:141. doi: 10.1186/1471-2105-12-141.

DOI:10.1186/1471-2105-12-141
PMID:21554720
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3098182/
Abstract

BACKGROUND

Genome and metagenome studies have identified thousands of protein families whose functions are poorly understood and for which techniques for functional characterization provide only partial information. For such proteins, the genome context can give further information about their functional context.

RESULTS

We describe a Bayesian method, based on a probabilistic topic model, which directly identifies functional modules of protein families. The method explores the co-occurrence patterns of protein families across a collection of sequence samples to infer a probabilistic model of arbitrarily-sized functional modules.

CONCLUSIONS

We show that our method identifies protein modules - some of which correspond to well-known biological processes - that are tightly interconnected with known functional interactions and are different from the interactions identified by pairwise co-occurrence. The modules are not specific to any given organism and may combine different realizations of a protein complex or pathway within different taxa.

摘要

背景

基因组和宏基因组研究已经鉴定出数千种功能尚不清楚的蛋白质家族,而功能特征描述技术只能提供部分信息。对于此类蛋白质,其基因组背景可以提供有关其功能背景的更多信息。

结果

我们描述了一种基于概率主题模型的贝叶斯方法,该方法可以直接识别蛋白质家族的功能模块。该方法探索了蛋白质家族在一系列序列样本中的共现模式,以推断任意大小的功能模块的概率模型。

结论

我们表明,我们的方法可以识别蛋白质模块 - 其中一些与已知的生物过程相对应 - 这些模块与已知的功能相互作用紧密相关,并且与通过两两共现识别的相互作用不同。这些模块不限于任何特定的生物体,并且可以在不同的分类单元中组合不同的蛋白质复合物或途径的实现。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/60d6ddecc537/1471-2105-12-141-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/0b5bb1105707/1471-2105-12-141-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/e37562bdc5c0/1471-2105-12-141-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/b77e7b821dcc/1471-2105-12-141-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/835aeff955ea/1471-2105-12-141-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/aa2d760257f2/1471-2105-12-141-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/60d6ddecc537/1471-2105-12-141-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/0b5bb1105707/1471-2105-12-141-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/e37562bdc5c0/1471-2105-12-141-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/b77e7b821dcc/1471-2105-12-141-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/835aeff955ea/1471-2105-12-141-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/aa2d760257f2/1471-2105-12-141-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fc6c/3098182/60d6ddecc537/1471-2105-12-141-6.jpg

相似文献

1
Inferring functional modules of protein families with probabilistic topic models.用概率主题模型推断蛋白质家族的功能模块。
BMC Bioinformatics. 2011 May 9;12:141. doi: 10.1186/1471-2105-12-141.
2
Inference of phenotype-defining functional modules of protein families for microbial plant biomass degraders.推断微生物植物生物质降解蛋白家族的表型定义功能模块。
Biotechnol Biofuels. 2014 Sep 9;7(1):124. doi: 10.1186/s13068-014-0124-8. eCollection 2014.
3
Identification and analysis of evolutionarily cohesive functional modules in protein networks.蛋白质网络中具有进化凝聚性的功能模块的识别与分析。
Genome Res. 2006 Mar;16(3):374-82. doi: 10.1101/gr.4336406. Epub 2006 Jan 31.
4
Combinations of ancestral modules in proteins.蛋白质中祖先模块的组合。
J Mol Evol. 2007 Dec;65(6):640-50. doi: 10.1007/s00239-007-9032-x. Epub 2007 Nov 20.
5
A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes.原核生物基因组中存在一个由45个CRISPR相关(Cas)蛋白家族和多种CRISPR/Cas亚型组成的群落。
PLoS Comput Biol. 2005 Nov;1(6):e60. doi: 10.1371/journal.pcbi.0010060. Epub 2005 Nov 11.
6
Inferring cellular networks using probabilistic graphical models.使用概率图模型推断细胞网络。
Science. 2004 Feb 6;303(5659):799-805. doi: 10.1126/science.1094068.
7
Inferring modules of functionally interacting proteins using the Bond Energy Algorithm.使用键能算法推断功能相互作用蛋白质的模块。
BMC Bioinformatics. 2008 Jun 17;9:285. doi: 10.1186/1471-2105-9-285.
8
A simple probabilistic model of multibody interactions in proteins.蛋白质中多体相互作用的简单概率模型。
Proteins. 2013 Aug;81(8):1340-50. doi: 10.1002/prot.24277. Epub 2013 Apr 22.
9
Estimating functional groups in human gut microbiome with probabilistic topic models.用概率主题模型估计人类肠道微生物组中的功能群。
IEEE Trans Nanobioscience. 2012 Sep;11(3):203-15. doi: 10.1109/TNB.2012.2212204.
10
A Bayesian model comparison approach to inferring positive selection.一种用于推断正选择的贝叶斯模型比较方法。
Mol Biol Evol. 2005 Dec;22(12):2531-40. doi: 10.1093/molbev/msi250. Epub 2005 Aug 24.

引用本文的文献

1
An overview of topic modeling and its current applications in bioinformatics.主题建模概述及其在生物信息学中的当前应用。
Springerplus. 2016 Sep 20;5(1):1608. doi: 10.1186/s40064-016-3252-8. eCollection 2016.
2
Understanding Genotype-Phenotype Effects in Cancer via Network Approaches.通过网络方法理解癌症中的基因型-表型效应。
PLoS Comput Biol. 2016 Mar 10;12(3):e1004747. doi: 10.1371/journal.pcbi.1004747. eCollection 2016 Mar.
3
Inference of phenotype-defining functional modules of protein families for microbial plant biomass degraders.

本文引用的文献

1
Network-based function prediction and interactomics: the case for metabolic enzymes.基于网络的功能预测和互作组学:以代谢酶为例。
Metab Eng. 2011 Jan;13(1):1-10. doi: 10.1016/j.ymben.2010.07.001. Epub 2010 Jul 21.
2
Predicting protein-protein relationships from literature using latent topics.利用潜在主题从文献中预测蛋白质-蛋白质关系。
Genome Inform. 2009 Oct;23(1):3-12.
3
Machine learning methods for metabolic pathway prediction.机器学习方法在代谢途径预测中的应用。
推断微生物植物生物质降解蛋白家族的表型定义功能模块。
Biotechnol Biofuels. 2014 Sep 9;7(1):124. doi: 10.1186/s13068-014-0124-8. eCollection 2014.
4
A Module Analysis Approach to Investigate Molecular Mechanism of TCM Formula: A Trial on Shu-feng-jie-du Formula.一种用于探究中医方剂分子机制的模块分析方法:疏风解毒方剂的试验。
Evid Based Complement Alternat Med. 2013;2013:731370. doi: 10.1155/2013/731370. Epub 2013 Nov 26.
5
Metagenomic annotation networks: construction and applications.元基因组注释网络:构建与应用。
PLoS One. 2012;7(8):e41283. doi: 10.1371/journal.pone.0041283. Epub 2012 Aug 7.
BMC Bioinformatics. 2010 Jan 8;11:15. doi: 10.1186/1471-2105-11-15.
4
Pandora, a pathway and network discovery approach based on common biological evidence.基于常见生物证据的通路和网络发现方法——Pandora。
Bioinformatics. 2010 Feb 15;26(4):529-35. doi: 10.1093/bioinformatics/btp701. Epub 2009 Dec 22.
5
eggNOG v2.0: extending the evolutionary genealogy of genes with enhanced non-supervised orthologous groups, species and functional annotations.eggNOG v2.0:通过增强的非监督同源物聚类、物种和功能注释,扩展基因的进化系统发生。
Nucleic Acids Res. 2010 Jan;38(Database issue):D190-5. doi: 10.1093/nar/gkp951. Epub 2009 Nov 9.
6
FIGfams: yet another set of protein families.FIGfams:另一组蛋白质家族。
Nucleic Acids Res. 2009 Nov;37(20):6643-54. doi: 10.1093/nar/gkp698. Epub 2009 Sep 17.
7
Predicting homologous signaling pathways using machine learning.使用机器学习预测同源信号通路。
Bioinformatics. 2009 Nov 15;25(22):2913-20. doi: 10.1093/bioinformatics/btp532. Epub 2009 Sep 7.
8
Protein function prediction--the power of multiplicity.蛋白质功能预测——多样性的力量。
Trends Biotechnol. 2009 Apr;27(4):210-9. doi: 10.1016/j.tibtech.2009.01.002. Epub 2009 Feb 27.
9
Revealing biological modules via graph summarization.通过图摘要揭示生物模块。
J Comput Biol. 2009 Feb;16(2):253-64. doi: 10.1089/cmb.2008.11TT.
10
An invitation to the marriage of metagenomics and metabolomics.宏基因组学与代谢组学联姻的邀请函。
Cell. 2008 Sep 5;134(5):708-13. doi: 10.1016/j.cell.2008.08.025.