• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

鉴别基序

Discriminative motifs.

作者信息

Sinha Saurabh

机构信息

Center for Studies in Physics and Biology, Box 25, The Rockefeller University, New York, NY 10021, USA.

出版信息

J Comput Biol. 2003;10(3-4):599-615. doi: 10.1089/10665270360688219.

DOI:10.1089/10665270360688219
PMID:12935347
Abstract

This paper takes a new view of motif discovery, addressing a common problem in existing motif finders. A motif is treated as a feature of the input promoter regions that leads to a good classifier between these promoters and a set of background promoters. This perspective allows us to adapt existing methods of feature selection, a well-studied topic in machine learning, to motif discovery. We develop a general algorithmic framework that can be specialized to work with a wide variety of motif models, including consensus models with degenerate symbols or mismatches, and composite motifs. A key feature of our algorithm is that it measures overrepresentation while maintaining information about the distribution of motif instances in individual promoters. The assessment of a motif's discriminative power is normalized against chance behaviour by a probabilistic analysis. We apply our framework to two popular motif models and are able to detect several known binding sites in sets of co-regulated genes in yeast.

摘要

本文对基序发现提出了一种新观点,解决了现有基序查找器中的一个常见问题。基序被视为输入启动子区域的一个特征,该特征能在这些启动子与一组背景启动子之间产生良好的分类器。这种观点使我们能够将机器学习中一个经过充分研究的主题——现有特征选择方法应用于基序发现。我们开发了一个通用算法框架,该框架可以专门用于处理各种基序模型,包括具有简并符号或错配的共有模型以及复合基序。我们算法的一个关键特征是,它在测量过表达的同时,还能保留关于单个启动子中基序实例分布的信息。通过概率分析,将基序判别力的评估与随机行为进行归一化。我们将我们的框架应用于两种流行的基序模型,并能够在酵母中共同调控基因集中检测到几个已知的结合位点。

相似文献

1
Discriminative motifs.鉴别基序
J Comput Biol. 2003;10(3-4):599-615. doi: 10.1089/10665270360688219.
2
Probabilistic models for semisupervised discriminative motif discovery in DNA sequences.用于 DNA 序列中半监督判别基序发现的概率模型。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Sep-Oct;8(5):1309-17. doi: 10.1109/TCBB.2010.84.
3
An Algorithm for Motif Discovery with Iteration on Lengths of Motifs.一种基于基序长度迭代的基序发现算法。
IEEE/ACM Trans Comput Biol Bioinform. 2015 Jan-Feb;12(1):136-41. doi: 10.1109/TCBB.2014.2351793.
4
Parametric bootstrapping for biological sequence motifs.生物序列基序的参数自举法
BMC Bioinformatics. 2016 Oct 6;17(1):406. doi: 10.1186/s12859-016-1246-8.
5
A cluster refinement algorithm for motif discovery.一种用于发现模体的簇精炼算法。
IEEE/ACM Trans Comput Biol Bioinform. 2010 Oct-Dec;7(4):654-68. doi: 10.1109/TCBB.2009.25.
6
Finding motifs from all sequences with and without binding sites.从所有具有和不具有结合位点的序列中寻找基序。
Bioinformatics. 2006 Sep 15;22(18):2217-23. doi: 10.1093/bioinformatics/btl371. Epub 2006 Jul 26.
7
Using SCOPE to identify potential regulatory motifs in coregulated genes.使用SCOPE鉴定共调控基因中的潜在调控基序。
J Vis Exp. 2011 May 31(51):2703. doi: 10.3791/2703.
8
Adaptive multi-agent architecture for functional sequence motifs recognition.自适应多代理体系结构,用于功能序列基元识别。
Bioinformatics. 2009 Dec 1;25(23):3084-92. doi: 10.1093/bioinformatics/btp567. Epub 2009 Oct 6.
9
A discriminative approach for unsupervised clustering of DNA sequence motifs.一种用于 DNA 序列基序无监督聚类的判别方法。
PLoS Comput Biol. 2013;9(3):e1002958. doi: 10.1371/journal.pcbi.1002958. Epub 2013 Mar 21.
10
Inferring regulatory elements from a whole genome. An analysis of Helicobacter pylori sigma(80) family of promoter signals.从全基因组推断调控元件。幽门螺杆菌σ80启动子信号家族分析。
J Mol Biol. 2000 Mar 24;297(2):335-53. doi: 10.1006/jmbi.2000.3576.

引用本文的文献

1
Accurate prediction of -regulatory modules reveals a prevalent regulatory genome of humans.对调控模块的准确预测揭示了人类普遍存在的调控基因组。
NAR Genom Bioinform. 2021 Jun 17;3(2):lqab052. doi: 10.1093/nargab/lqab052. eCollection 2021 Jun.
2
Uncovering Effective Explanations for Interactive Genomic Data Analysis.揭示交互式基因组数据分析的有效解释。
Patterns (N Y). 2020 Sep 11;1(6):100093. doi: 10.1016/j.patter.2020.100093.
3
ProSampler: an ultrafast and accurate motif finder in large ChIP-seq datasets for combinatory motif discovery.
ProSampler:一种在大型 ChIP-seq 数据集中用于组合基序发现的超快速和准确的基序查找器。
Bioinformatics. 2019 Nov 1;35(22):4632-4639. doi: 10.1093/bioinformatics/btz290.
4
SArKS: de novo discovery of gene expression regulatory motif sites and domains by suffix array kernel smoothing.SArKS:通过后缀数组核平滑进行基因表达调控基序位点和结构域的从头发现。
Bioinformatics. 2019 Oct 15;35(20):3944-3952. doi: 10.1093/bioinformatics/btz198.
5
SeAMotE: a method for high-throughput motif discovery in nucleic acid sequences.SeAMotE:一种用于在核酸序列中进行高通量基序发现的方法。
BMC Genomics. 2014 Oct 23;15(1):925. doi: 10.1186/1471-2164-15-925.
6
Discriminative motif optimization based on perceptron training.基于感知机训练的判别模式优化。
Bioinformatics. 2014 Apr 1;30(7):941-8. doi: 10.1093/bioinformatics/btt748. Epub 2013 Dec 24.
7
The limits of de novo DNA motif discovery.从头开始的 DNA 基序发现的局限性。
PLoS One. 2012;7(11):e47836. doi: 10.1371/journal.pone.0047836. Epub 2012 Nov 7.
8
DECOD: fast and accurate discriminative DNA motif finding.DECOD:快速且准确的判别式 DNA 基序发现。
Bioinformatics. 2011 Sep 1;27(17):2361-7. doi: 10.1093/bioinformatics/btr412. Epub 2011 Jul 12.
9
MotifClick: prediction of cis-regulatory binding sites via merging cliques.MotifClick:通过合并节点预测顺式调控结合位点。
BMC Bioinformatics. 2011 Jun 16;12:238. doi: 10.1186/1471-2105-12-238.
10
Computational identification of tissue-specific alternative splicing elements in mouse genes from RNA-Seq.基于 RNA-Seq 数据的小鼠基因组织特异性可变剪接元件的计算识别
Nucleic Acids Res. 2010 Dec;38(22):7895-907. doi: 10.1093/nar/gkq679. Epub 2010 Aug 4.