• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

马尔可夫链模式统计的数值解。

Numerical solutions for patterns statistics on Markov chains.

作者信息

Nuel Gregory

机构信息

Laboratoire Statistique et Genome, CNRS (8071), INRA (1152), UEVE, Evry, France.

出版信息

Stat Appl Genet Mol Biol. 2006;5:Article26. doi: 10.2202/1544-6115.1219. Epub 2006 Oct 17.

DOI:10.2202/1544-6115.1219
PMID:17049037
Abstract

We propose here a review of the methods available to compute pattern statistics on text generated by a Markov source. Theoretical, but also numerical aspects are detailed for a wide range of techniques (exact, Gaussian, large deviations, binomial and compound Poisson). The SPatt package (Statistics for Pattern, free software available at http://stat.genopole.cnrs.fr/spatt) implementing all these methods is then used to compare all these approaches in terms of computational time and reliability in the most complete pattern statistics benchmark available at the present time.

摘要

我们在此提议对可用于计算马尔可夫源生成文本的模式统计量的方法进行综述。针对广泛的技术(精确方法、高斯方法、大偏差方法、二项式方法和复合泊松方法),详细阐述了理论及数值方面的内容。然后,使用实现所有这些方法的SPatt软件包(模式统计,可从http://stat.genopole.cnrs.fr/spatt获取的免费软件),在当前最完整的模式统计基准测试中,从计算时间和可靠性方面对所有这些方法进行比较。

相似文献

1
Numerical solutions for patterns statistics on Markov chains.马尔可夫链模式统计的数值解。
Stat Appl Genet Mol Biol. 2006;5:Article26. doi: 10.2202/1544-6115.1219. Epub 2006 Oct 17.
2
LD-SPatt: large deviations statistics for patterns on Markov chains.LD-SPatt:马尔可夫链上模式的大偏差统计
J Comput Biol. 2004;11(6):1023-33. doi: 10.1089/cmb.2004.11.1023.
3
Drifting Markov models with polynomial drift and applications to DNA sequences.具有多项式漂移的漂移马尔可夫模型及其在DNA序列中的应用。
Stat Appl Genet Mol Biol. 2008;7(1):Article6. doi: 10.2202/1544-6115.1326. Epub 2008 Feb 21.
4
Calibrating E-values for hidden Markov models using reverse-sequence null models.使用反向序列空模型校准隐马尔可夫模型的E值。
Bioinformatics. 2005 Nov 15;21(22):4107-15. doi: 10.1093/bioinformatics/bti629. Epub 2005 Aug 25.
5
Fast model-based protein homology detection without alignment.基于快速模型的无需比对的蛋白质同源性检测。
Bioinformatics. 2007 Jul 15;23(14):1728-36. doi: 10.1093/bioinformatics/btm247. Epub 2007 May 8.
6
S-SPatt: simple statistics for patterns on Markov chains.S-SPatt:马尔可夫链上模式的简单统计量
Bioinformatics. 2005 Jul 1;21(13):3051-2. doi: 10.1093/bioinformatics/bti451. Epub 2005 Apr 19.
7
FunCat functional inference with belief propagation and feature integration.基于信念传播和特征整合的FunCat功能推理
Comput Biol Chem. 2008 Oct;32(5):375-7. doi: 10.1016/j.compbiolchem.2008.06.004. Epub 2008 Jul 3.
8
Effect of noise on defect chaos in a reaction-diffusion model.噪声对反应扩散模型中缺陷混沌的影响。
Chaos. 2005 Jun;15(2):23702. doi: 10.1063/1.1886305.
9
Estimation of distribution algorithms with Kikuchi approximations.基于菊池近似的分布估计算法
Evol Comput. 2005 Spring;13(1):67-97. doi: 10.1162/1063656053583496.
10
Efficient representation and P-value computation for high-order Markov motifs.高阶马尔可夫基序的高效表示与P值计算
Bioinformatics. 2008 Aug 15;24(16):i160-6. doi: 10.1093/bioinformatics/btn282.

引用本文的文献

1
Analysis of pattern overlaps and exact computation of P-values of pattern occurrences numbers: case of Hidden Markov Models.模式重叠分析与模式出现次数的P值精确计算:隐马尔可夫模型的情况
Algorithms Mol Biol. 2014 Dec 16;9(1):25. doi: 10.1186/s13015-014-0025-1. eCollection 2014.
2
Dissecting protein loops with a statistical scalpel suggests a functional implication of some structural motifs.用统计手术刀剖析蛋白质环,提示了某些结构模体的功能意义。
BMC Bioinformatics. 2011 Jun 20;12:247. doi: 10.1186/1471-2105-12-247.
3
SA-Mot: a web server for the identification of motifs of interest extracted from protein loops.
SA-Mot:一个从蛋白质环中提取感兴趣的模体的 web 服务器。
Nucleic Acids Res. 2011 Jul;39(Web Server issue):W203-9. doi: 10.1093/nar/gkr410. Epub 2011 Jun 10.
4
An analysis of single amino acid repeats as use case for application specific background models.分析单氨基酸重复序列作为特定应用背景模型的应用案例。
BMC Bioinformatics. 2011 May 19;12:173. doi: 10.1186/1471-2105-12-173.
5
The power of detecting enriched patterns: an HMM approach.检测富集模式的能力:一种隐马尔可夫模型方法。
J Comput Biol. 2010 Apr;17(4):581-92. doi: 10.1089/cmb.2009.0218.
6
Exact distribution of a pattern in a set of random sequences generated by a Markov source: applications to biological data.马尔可夫源生成的一组随机序列中模式的精确分布:在生物数据中的应用。
Algorithms Mol Biol. 2010 Jan 26;5:15. doi: 10.1186/1748-7188-5-15.
7
Mining protein loops using a structural alphabet and statistical exceptionality.使用结构字母表和统计异常挖掘蛋白质环。
BMC Bioinformatics. 2010 Feb 4;11:75. doi: 10.1186/1471-2105-11-75.
8
Globally, unrelated protein sequences appear random.在全球范围内,不相关的蛋白质序列看起来是随机的。
Bioinformatics. 2010 Feb 1;26(3):310-8. doi: 10.1093/bioinformatics/btp660. Epub 2009 Nov 30.