• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于检测多个序列共享的短相邻重复的 MCMC 算法。

An MCMC algorithm for detecting short adjacent repeats shared by multiple sequences.

机构信息

Department of Statistics, The Chinese University of Hong Kong, Sha Tin, New Territories, Hong Kong.

出版信息

Bioinformatics. 2011 Jul 1;27(13):1772-9. doi: 10.1093/bioinformatics/btr287. Epub 2011 May 6.

DOI:10.1093/bioinformatics/btr287
PMID:21551149
Abstract

MOTIVATION

Repeats detection problems are traditionally formulated as string matching or signal processing problems. They cannot readily handle gaps between repeat units and are incapable of detecting repeat patterns shared by multiple sequences. This study detects short adjacent repeats with interunit insertions from multiple sequences. For biological sequences, such studies can shed light on molecular structure, biological function and evolution.

RESULTS

The task of detecting short adjacent repeats is formulated as a statistical inference problem by using a probabilistic generative model. An Markov chain Monte Carlo algorithm is proposed to infer the parameters in a de novo fashion. Its applications on synthetic and real biological data show that the new method not only has a competitive edge over existing methods, but also can provide a way to study the structure and the evolution of repeat-containing genes.

AVAILABILITY

The related C++ source code and datasets are available at http://ihome.cuhk.edu.hk/%7Eb118998/share/BASARD.zip.

CONTACT

xfan@sta.cuhk.edu.hk

摘要

动机

重复检测问题传统上被表述为字符串匹配或信号处理问题。它们不能很好地处理重复单元之间的间隙,也无法检测多个序列共享的重复模式。本研究从多个序列中检测具有单元间插入的短相邻重复。对于生物序列,此类研究可以揭示分子结构、生物功能和进化。

结果

通过使用概率生成模型,将检测短相邻重复的任务表述为统计推断问题。提出了一种马尔可夫链蒙特卡罗算法来以全新的方式推断参数。它在合成和真实生物数据上的应用表明,新方法不仅比现有方法具有竞争优势,而且还可以提供一种研究重复基因结构和进化的方法。

可用性

相关的 C++源代码和数据集可在 http://ihome.cuhk.edu.hk/%7Eb118998/share/BASARD.zip 上获得。

联系方式

xfan@sta.cuhk.edu.hk

相似文献

1
An MCMC algorithm for detecting short adjacent repeats shared by multiple sequences.一种用于检测多个序列共享的短相邻重复的 MCMC 算法。
Bioinformatics. 2011 Jul 1;27(13):1772-9. doi: 10.1093/bioinformatics/btr287. Epub 2011 May 6.
2
Detection of dispersed short tandem repeats using reversible jump Markov chain Monte Carlo.使用可逆跳转马尔可夫链蒙特卡罗法检测分散的短串联重复序列。
Nucleic Acids Res. 2012 Oct;40(19):e147. doi: 10.1093/nar/gks644. Epub 2012 Jun 29.
3
Estimation of evolutionary parameters using short, random and partial sequences from mixed samples of anonymous individuals.利用来自匿名个体混合样本的短的、随机的和部分序列估计进化参数。
BMC Bioinformatics. 2015 Nov 4;16:357. doi: 10.1186/s12859-015-0810-y.
4
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
5
Improved short adjacent repeat identification using three evolutionary Monte Carlo schemes.使用三种进化蒙特卡罗方法改进短相邻重复序列识别
Int J Data Min Bioinform. 2013;8(4):462-79. doi: 10.1504/ijdmb.2013.056614.
6
T-REKS: identification of Tandem REpeats in sequences with a K-meanS based algorithm.T-REKS:基于 K-均值算法的序列中串联重复序列的识别。
Bioinformatics. 2009 Oct 15;25(20):2632-8. doi: 10.1093/bioinformatics/btp482. Epub 2009 Aug 11.
7
BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny.BAli-Phy:比对和系统发育的同步贝叶斯推断
Bioinformatics. 2006 Aug 15;22(16):2047-8. doi: 10.1093/bioinformatics/btl175. Epub 2006 May 5.
8
Parallel Metropolis coupled Markov chain Monte Carlo for Bayesian phylogenetic inference.用于贝叶斯系统发育推断的并行 metropolis 耦合马尔可夫链蒙特卡罗方法
Bioinformatics. 2004 Feb 12;20(3):407-15. doi: 10.1093/bioinformatics/btg427. Epub 2004 Jan 22.
9
BEST: Bayesian estimation of species trees under the coalescent model.BEST:在溯祖模型下物种树的贝叶斯估计。
Bioinformatics. 2008 Nov 1;24(21):2542-3. doi: 10.1093/bioinformatics/btn484. Epub 2008 Sep 17.
10
Bayesian models and Markov chain Monte Carlo methods for protein motifs with the secondary characteristics.具有二级特征的蛋白质基序的贝叶斯模型和马尔可夫链蒙特卡罗方法。
J Comput Biol. 2005 Sep;12(7):952-70. doi: 10.1089/cmb.2005.12.952.

引用本文的文献

1
Detection of dispersed short tandem repeats using reversible jump Markov chain Monte Carlo.使用可逆跳转马尔可夫链蒙特卡罗法检测分散的短串联重复序列。
Nucleic Acids Res. 2012 Oct;40(19):e147. doi: 10.1093/nar/gks644. Epub 2012 Jun 29.