• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种基于轮廓的确定性序贯蒙特卡罗基序发现算法。

A profile-based deterministic sequential Monte Carlo algorithm for motif discovery.

作者信息

Liang Kuo-Ching, Wang Xiaodong, Anastassiou Dimitris

机构信息

Columbia University, Department of Electrical Engineering, New York, NY 10025, USA.

出版信息

Bioinformatics. 2008 Jan 1;24(1):46-55. doi: 10.1093/bioinformatics/btm543. Epub 2007 Nov 17.

DOI:10.1093/bioinformatics/btm543
PMID:18024972
Abstract

MOTIVATION

Conserved motifs often represent biological significance, providing insight on biological aspects such as gene transcription regulation, biomolecular secondary structure, presence of non-coding RNAs and evolution history. With the increasing number of sequenced genomic data, faster and more accurate tools are needed to automate the process of motif discovery.

RESULTS

We propose a deterministic sequential Monte Carlo (DSMC) motif discovery technique based on the position weight matrix (PWM) model to locate conserved motifs in a given set of nucleotide sequences, and extend our model to search for instances of the motif with insertions/deletions. We show that the proposed method can be used to align the motif where there are insertions and deletions found in different instances of the motif, which cannot be satisfactorily done using other multiple alignment and motif discovery algorithms.

AVAILABILITY

MATLAB code is available at http://www.ee.columbia.edu/~kcliang

摘要

动机

保守基序通常具有生物学意义,能为基因转录调控、生物分子二级结构、非编码RNA的存在及进化历史等生物学方面提供见解。随着测序基因组数据数量的增加,需要更快、更准确的工具来自动化基序发现过程。

结果

我们提出了一种基于位置权重矩阵(PWM)模型的确定性序贯蒙特卡罗(DSMC)基序发现技术,用于在给定的核苷酸序列集中定位保守基序,并扩展我们的模型以搜索带有插入/缺失的基序实例。我们表明,所提出的方法可用于比对在基序的不同实例中发现有插入和缺失的基序,而使用其他多重比对和基序发现算法无法令人满意地完成此操作。

可用性

MATLAB代码可在http://www.ee.columbia.edu/~kcliang获取

相似文献

1
A profile-based deterministic sequential Monte Carlo algorithm for motif discovery.一种基于轮廓的确定性序贯蒙特卡罗基序发现算法。
Bioinformatics. 2008 Jan 1;24(1):46-55. doi: 10.1093/bioinformatics/btm543. Epub 2007 Nov 17.
2
A Gibbs sampler for identification of symmetrically structured, spaced DNA motifs with improved estimation of the signal length.一种用于识别具有对称结构、间隔的DNA基序并改进信号长度估计的吉布斯采样器。
Bioinformatics. 2005 May 15;21(10):2240-5. doi: 10.1093/bioinformatics/bti336. Epub 2005 Feb 22.
3
A generic motif discovery algorithm for sequential data.一种用于序列数据的通用基序发现算法。
Bioinformatics. 2006 Jan 1;22(1):21-8. doi: 10.1093/bioinformatics/bti745. Epub 2005 Oct 27.
4
MUSA: a parameter free algorithm for the identification of biologically significant motifs.MUSA:一种用于识别具有生物学意义基序的无参数算法。
Bioinformatics. 2006 Dec 15;22(24):2996-3002. doi: 10.1093/bioinformatics/btl537. Epub 2006 Oct 26.
5
MotifCut: regulatory motifs finding with maximum density subgraphs.MotifCut:通过最大密度子图寻找调控基序
Bioinformatics. 2006 Jul 15;22(14):e150-7. doi: 10.1093/bioinformatics/btl243.
6
Informative priors based on transcription factor structural class improve de novo motif discovery.基于转录因子结构类别的信息先验改进了从头基序发现。
Bioinformatics. 2006 Jul 15;22(14):e384-92. doi: 10.1093/bioinformatics/btl251.
7
Apples to apples: improving the performance of motif finders and their significance analysis in the Twilight Zone.同类比较:提升模体发现工具在临界区域的性能及其显著性分析
Bioinformatics. 2006 Jul 15;22(14):e393-401. doi: 10.1093/bioinformatics/btl245.
8
Statistical detection of chromosomal homology using shared-gene density alone.仅使用共享基因密度进行染色体同源性的统计检测。
Bioinformatics. 2005 Apr 15;21(8):1339-48. doi: 10.1093/bioinformatics/bti168. Epub 2004 Dec 7.
9
Sigma: multiple alignment of weakly-conserved non-coding DNA sequence.西格玛:弱保守非编码DNA序列的多重比对
BMC Bioinformatics. 2006 Mar 16;7:143. doi: 10.1186/1471-2105-7-143.
10
Generalized hierarchical markov models for the discovery of length-constrained sequence features from genome tiling arrays.用于从基因组平铺阵列中发现长度受限序列特征的广义分层马尔可夫模型。
Biometrics. 2007 Sep;63(3):797-805. doi: 10.1111/j.1541-0420.2007.00760.x.

引用本文的文献

1
Freezing firefly algorithm for efficient planted (ℓ, d) motif search.用于有效搜索种植 (ℓ, d) 基序的冻结萤火虫算法。
Med Biol Eng Comput. 2022 Feb;60(2):511-530. doi: 10.1007/s11517-021-02468-x. Epub 2022 Jan 12.
2
Joint haplotype assembly and genotype calling via sequential Monte Carlo algorithm.通过序贯蒙特卡罗算法进行联合单倍型组装和基因型分型
BMC Bioinformatics. 2015 Jul 16;16:223. doi: 10.1186/s12859-015-0651-8.
3
A survey of motif finding Web tools for detecting binding site motifs in ChIP-Seq data.一个关于 motif 发现网络工具的调查,用于检测 ChIP-Seq 数据中的结合位点 motif。
Biol Direct. 2014 Feb 20;9:4. doi: 10.1186/1745-6150-9-4.
4
Position weight matrix, gibbs sampler, and the associated significance tests in motif characterization and prediction.位置权重矩阵、吉布斯采样器以及基序表征与预测中的相关显著性检验。
Scientifica (Cairo). 2012;2012:917540. doi: 10.6064/2012/917540. Epub 2012 Oct 23.
5
Bayesian multiple-instance motif discovery with BAMBI: inference of recombinase and transcription factor binding sites.贝叶斯多实例基序发现与 BAMBI:重组酶和转录因子结合位点的推断。
Nucleic Acids Res. 2011 Nov;39(21):e146. doi: 10.1093/nar/gkr745. Epub 2011 Sep 24.