• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GAME:使用遗传算法检测顺式调控元件

GAME: detecting cis-regulatory elements using a genetic algorithm.

作者信息

Wei Zhi, Jensen Shane T

机构信息

Genomics and Computational Biology Graduate Group, University of Pennsylvania School of Medicine Philadelphia, 19104, USA.

出版信息

Bioinformatics. 2006 Jul 1;22(13):1577-84. doi: 10.1093/bioinformatics/btl147. Epub 2006 Apr 21.

DOI:10.1093/bioinformatics/btl147
PMID:16632495
Abstract

MOTIVATION

Identification of a transcription factor binding sites is an important aspect of the analysis of genetic regulation. Many programs have been developed for the de novo discovery of a binding motif (collection of binding sites). Recently, a scoring function formulation was derived that allows for the comparison of discovered motifs from different programs [S.T. Jensen, X.S. Liu, Q. Zhou and J.S. Liu (2004) Stat. Sci., 19, 188-204.] A simple program, BioOptimizer, was proposed in [S.T. Jensen and J.S. Liu (2004) Bioinformatics, 20, 1557-1564.] that improved discovered motifs by optimizing a scoring function. However, BioOptimizer is a very simple algorithm that can only make local improvements upon an already discovered motif and so BioOptimizer can only be used in conjunction with other motif-finding software.

RESULTS

We introduce software, GAME, which utilizes a genetic algorithm to find optimal motifs in DNA sequences. GAME evolves motifs with high fitness from a population of randomly generated starting motifs, which eliminate the reliance on additional motif-finding programs. In addition to using standard genetic operations, GAME also incorporates two additional operators that are specific to the motif discovery problem. We demonstrate the superior performance of GAME compared with MEME, BioProspector and BioOptimizer in simulation studies as well as several real data applications where we use an extended version of the GAME algorithm that allows the motif width to be unknown.

摘要

动机

转录因子结合位点的识别是基因调控分析的一个重要方面。已经开发了许多程序用于从头发现结合基序(结合位点的集合)。最近,推导了一种评分函数公式,可用于比较不同程序发现的基序 [S.T. 詹森、X.S. 刘、Q. 周和 J.S. 刘(2004 年)《统计科学》,19,188 - 204]。在 [S.T. 詹森和 J.S. 刘(2004 年)《生物信息学》,20,1557 - 1564] 中提出了一个简单的程序 BioOptimizer,它通过优化评分函数来改进发现的基序。然而,BioOptimizer 是一种非常简单的算法,只能对已经发现的基序进行局部改进,因此 BioOptimizer 只能与其他基序查找软件结合使用。

结果

我们介绍了软件 GAME,它利用遗传算法在 DNA 序列中找到最优基序。GAME 从随机生成的起始基序群体中进化出具有高适应性的基序,从而消除了对其他基序查找程序的依赖。除了使用标准的遗传操作外,GAME 还纳入了两个特定于基序发现问题的额外算子。在模拟研究以及几个实际数据应用中,我们展示了 GAME 与 MEME、BioProspector 和 BioOptimizer 相比具有卓越的性能,在这些应用中我们使用了 GAME 算法的扩展版本,该版本允许基序宽度未知。

相似文献

1
GAME: detecting cis-regulatory elements using a genetic algorithm.GAME:使用遗传算法检测顺式调控元件
Bioinformatics. 2006 Jul 1;22(13):1577-84. doi: 10.1093/bioinformatics/btl147. Epub 2006 Apr 21.
2
BioOptimizer: a Bayesian scoring function approach to motif discovery.生物优化器:一种用于基序发现的贝叶斯评分函数方法。
Bioinformatics. 2004 Jul 10;20(10):1557-64. doi: 10.1093/bioinformatics/bth127. Epub 2004 Feb 12.
3
MotifCut: regulatory motifs finding with maximum density subgraphs.MotifCut:通过最大密度子图寻找调控基序
Bioinformatics. 2006 Jul 15;22(14):e150-7. doi: 10.1093/bioinformatics/btl243.
4
On counting position weight matrix matches in a sequence, with application to discriminative motif finding.关于计算序列中的位置权重矩阵匹配及其在判别性基序发现中的应用。
Bioinformatics. 2006 Jul 15;22(14):e454-63. doi: 10.1093/bioinformatics/btl227.
5
WebMOTIFS: automated discovery, filtering and scoring of DNA sequence motifs using multiple programs and Bayesian approaches.WebMOTIFS:使用多个程序和贝叶斯方法对DNA序列基序进行自动发现、筛选和评分。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W217-20. doi: 10.1093/nar/gkm376. Epub 2007 Jun 21.
6
SPACER: identification of cis-regulatory elements with non-contiguous critical residues.间隔序列:具有非连续关键残基的顺式调控元件的鉴定
Bioinformatics. 2007 Apr 15;23(8):1029-31. doi: 10.1093/bioinformatics/btm041.
7
A generic motif discovery algorithm for sequential data.一种用于序列数据的通用基序发现算法。
Bioinformatics. 2006 Jan 1;22(1):21-8. doi: 10.1093/bioinformatics/bti745. Epub 2005 Oct 27.
8
Localized motif discovery in gene regulatory sequences.基因调控序列中的局部模体发现。
Bioinformatics. 2010 May 1;26(9):1152-9. doi: 10.1093/bioinformatics/btq106. Epub 2010 Mar 11.
9
PRECISE: software for prediction of cis-acting regulatory elements.PRECISE:用于预测顺式作用调控元件的软件。
J Hered. 2005 Sep-Oct;96(5):618-22. doi: 10.1093/jhered/esi094. Epub 2005 Aug 31.
10
Hybrid Gibbs-sampling algorithm for challenging motif discovery: GibbsDST.用于具有挑战性的基序发现的混合吉布斯采样算法:GibbsDST
Genome Inform. 2006;17(2):3-13.

引用本文的文献

1
A Review on Planted (, d) Motif Discovery Algorithms for Medical Diagnose.基于(, d)基序发现算法的医学诊断综述。
Sensors (Basel). 2022 Feb 5;22(3):1204. doi: 10.3390/s22031204.
2
Review of Different Sequence Motif Finding Algorithms.不同序列基序查找算法综述。
Avicenna J Med Biotechnol. 2019 Apr-Jun;11(2):130-148.
3
Dempster-Shafer Theory for the Prediction of Auxin-Response Elements (AuxREs) in Plant Genomes.Dempster-Shafer 理论在植物基因组中预测生长素响应元件 (AuxREs) 的应用。
Biomed Res Int. 2018 Nov 1;2018:3837060. doi: 10.1155/2018/3837060. eCollection 2018.
4
Noncoding Variants Functional Prioritization Methods Based on Predicted Regulatory Factor Binding Sites.基于预测调控因子结合位点的非编码变异功能优先级排序方法
Curr Genomics. 2017 Aug;18(4):322-331. doi: 10.2174/1389202918666170228143619.
5
PISMA: A Visual Representation of Motif Distribution in DNA Sequences.PISMA:DNA序列中基序分布的可视化表示。
Bioinform Biol Insights. 2017 Mar 30;11:1177932217700907. doi: 10.1177/1177932217700907. eCollection 2017.
6
An Entropy-Based Position Projection Algorithm for Motif Discovery.一种基于熵的用于基序发现的位置投影算法。
Biomed Res Int. 2016;2016:9127474. doi: 10.1155/2016/9127474. Epub 2016 Nov 2.
7
Alignment-free clustering of transcription factor binding motifs using a genetic-k-medoids approach.使用遗传k-中心点方法对转录因子结合基序进行无比对聚类。
BMC Bioinformatics. 2015 Jan 28;16:22. doi: 10.1186/s12859-015-0450-2.
8
MISCORE: a new scoring function for characterizing DNA regulatory motifs in promoter sequences.MISCORE:一种用于表征启动子序列中DNA调控基序的新评分函数。
BMC Syst Biol. 2012;6 Suppl 2(Suppl 2):S4. doi: 10.1186/1752-0509-6-S2-S4. Epub 2012 Dec 12.
9
Genetic variant representation, annotation and prioritization in the post-GWAS era.全基因组关联研究(GWAS)后时代的遗传变异表征、注释与优先级排序
Cell Res. 2012 Oct;22(10):1505-8. doi: 10.1038/cr.2012.106. Epub 2012 Jul 17.
10
PePPER: a webserver for prediction of prokaryote promoter elements and regulons.PePPER:一个用于预测原核生物启动子元件和调控子的网络服务器。
BMC Genomics. 2012 Jul 2;13:299. doi: 10.1186/1471-2164-13-299.