• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

量化基序之间的相似性。

Quantifying similarity between motifs.

作者信息

Gupta Shobhit, Stamatoyannopoulos John A, Bailey Timothy L, Noble William Stafford

机构信息

Department of Genome Sciences, University of Washington, 1705 NE Pacific Street, Box 355065, Seattle, WA 98195, USA.

出版信息

Genome Biol. 2007;8(2):R24. doi: 10.1186/gb-2007-8-2-r24.

DOI:10.1186/gb-2007-8-2-r24
PMID:17324271
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1852410/
Abstract

A common question within the context of de novo motif discovery is whether a newly discovered, putative motif resembles any previously discovered motif in an existing database. To answer this question, we define a statistical measure of motif-motif similarity, and we describe an algorithm, called Tomtom, for searching a database of motifs with a given query motif. Experimental simulations demonstrate the accuracy of Tomtom's E values and its effectiveness in finding similar motifs.

摘要

在从头基序发现的背景下,一个常见的问题是新发现的假定基序是否与现有数据库中任何先前发现的基序相似。为了回答这个问题,我们定义了一种基序-基序相似性的统计量度,并描述了一种名为Tomtom的算法,用于使用给定的查询基序搜索基序数据库。实验模拟证明了Tomtom的E值的准确性及其在寻找相似基序方面的有效性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/7a79566f6efc/gb-2007-8-2-r24-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/57d8083ab258/gb-2007-8-2-r24-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/415fc4d54492/gb-2007-8-2-r24-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/2b68d264c0ab/gb-2007-8-2-r24-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/a9a299f0a14b/gb-2007-8-2-r24-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/7a79566f6efc/gb-2007-8-2-r24-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/57d8083ab258/gb-2007-8-2-r24-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/415fc4d54492/gb-2007-8-2-r24-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/2b68d264c0ab/gb-2007-8-2-r24-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/a9a299f0a14b/gb-2007-8-2-r24-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ef4b/1852410/7a79566f6efc/gb-2007-8-2-r24-5.jpg

相似文献

1
Quantifying similarity between motifs.量化基序之间的相似性。
Genome Biol. 2007;8(2):R24. doi: 10.1186/gb-2007-8-2-r24.
2
GADEM: a genetic algorithm guided formation of spaced dyads coupled with an EM algorithm for motif discovery.GADEM:一种遗传算法引导的间隔二元组形成,结合期望最大化算法用于基序发现。
J Comput Biol. 2009 Feb;16(2):317-29. doi: 10.1089/cmb.2008.16TT.
3
Discovering sequence motifs.发现序列基序。
Methods Mol Biol. 2008;452:231-51. doi: 10.1007/978-1-60327-159-2_12.
4
MODSIDE: a motif discovery pipeline and similarity detector.MODSIDE:一种基序发现管道和相似度探测器。
BMC Genomics. 2018 Oct 19;19(1):755. doi: 10.1186/s12864-018-5148-1.
5
The value of position-specific priors in motif discovery using MEME.MEME 中位置特异性先验在基序发现中的价值。
BMC Bioinformatics. 2010 Apr 9;11:179. doi: 10.1186/1471-2105-11-179.
6
MEME SUITE: tools for motif discovery and searching.MEME套件:用于基序发现和搜索的工具。
Nucleic Acids Res. 2009 Jul;37(Web Server issue):W202-8. doi: 10.1093/nar/gkp335. Epub 2009 May 20.
7
Improved similarity scores for comparing motifs.改进了 motif 比较的相似度得分。
Bioinformatics. 2011 Jun 15;27(12):1603-9. doi: 10.1093/bioinformatics/btr257. Epub 2011 May 4.
8
A Monte Carlo-based framework enhances the discovery and interpretation of regulatory sequence motifs.基于蒙特卡罗的框架增强了调控序列基序的发现和解释。
BMC Bioinformatics. 2012 Nov 27;13:317. doi: 10.1186/1471-2105-13-317.
9
Efficient sequential and parallel algorithms for finding edit distance based motifs.用于查找基于编辑距离的基序的高效顺序和并行算法。
BMC Genomics. 2016 Aug 18;17 Suppl 4(Suppl 4):465. doi: 10.1186/s12864-016-2789-9.
10
GAME: detecting cis-regulatory elements using a genetic algorithm.GAME:使用遗传算法检测顺式调控元件
Bioinformatics. 2006 Jul 1;22(13):1577-84. doi: 10.1093/bioinformatics/btl147. Epub 2006 Apr 21.

引用本文的文献

1
Computational design of sequence-specific DNA-binding proteins.序列特异性DNA结合蛋白的计算设计
Nat Struct Mol Biol. 2025 Sep 12. doi: 10.1038/s41594-025-01669-4.
2
Epigenomic landscape of single vascular cells reflects developmental origin and disease risk loci.单个血管细胞的表观基因组景观反映发育起源和疾病风险位点。
Mol Syst Biol. 2025 Sep 10. doi: 10.1038/s44320-025-00140-2.
3
YModPred: an interpretable prediction method for multi-type RNA modification sites in S. cerevisiae based on deep learning.YModPred:一种基于深度学习的用于酿酒酵母中多类型RNA修饰位点的可解释预测方法。

本文引用的文献

1
T-Reg Comparator: an analysis tool for the comparison of position weight matrices.调节性T细胞比较器:一种用于比较位置权重矩阵的分析工具。
Nucleic Acids Res. 2005 Jul 1;33(Web Server issue):W438-41. doi: 10.1093/nar/gki590.
2
Assessing computational tools for the discovery of transcription factor binding sites.评估用于发现转录因子结合位点的计算工具。
Nat Biotechnol. 2005 Jan;23(1):137-44. doi: 10.1038/nbt1053.
3
Similarity of position frequency matrices for transcription factor binding sites.转录因子结合位点的位置频率矩阵的相似性。
BMC Biol. 2025 Aug 29;23(1):272. doi: 10.1186/s12915-025-02372-y.
4
Convergent evolution through independent rearrangements in the primate amylase locus.灵长类动物淀粉酶基因座通过独立重排的趋同进化。
bioRxiv. 2025 Aug 15:2025.08.14.670395. doi: 10.1101/2025.08.14.670395.
5
Base-resolution binding profile prediction of proteins on RNAs with deep learning.利用深度学习预测蛋白质在RNA上的碱基分辨率结合图谱。
Nucleic Acids Res. 2025 Jul 19;53(14). doi: 10.1093/nar/gkaf748.
6
Expanding the DNA Motif Lexicon of the Transcriptional Regulatory Code.扩展转录调控密码的DNA基序词汇表。
bioRxiv. 2025 Jul 15:2025.07.09.662874. doi: 10.1101/2025.07.09.662874.
7
Global cis-regulatory landscape of double-stranded DNA viruses.双链DNA病毒的全基因组顺式调控图谱
bioRxiv. 2025 Jul 20:2025.07.20.665756. doi: 10.1101/2025.07.20.665756.
8
SOX2 utilizes FOXA1 as a heteromeric transcriptional partner to drive proliferation in therapy-resistant prostate cancer.SOX2利用FOXA1作为异源转录伙伴来驱动去势抵抗性前列腺癌的增殖。
bioRxiv. 2025 Jul 19:2025.07.18.664790. doi: 10.1101/2025.07.18.664790.
9
EPI-DynFusion: enhancer-promoter interaction prediction model based on sequence features and dynamic fusion mechanisms.EPI-DynFusion:基于序列特征和动态融合机制的增强子-启动子相互作用预测模型。
Front Genet. 2025 Jul 23;16:1614222. doi: 10.3389/fgene.2025.1614222. eCollection 2025.
10
Dynamics of chromatin accessibility governing Gd-IgA1 synthesis in B cells associated with IgA nephropathy.与IgA肾病相关的B细胞中调控Gd-IgA1合成的染色质可及性动态变化
Exp Mol Med. 2025 Jul 23. doi: 10.1038/s12276-025-01505-1.
Bioinformatics. 2005 Feb 1;21(3):307-13. doi: 10.1093/bioinformatics/bth480. Epub 2004 Aug 19.
4
WebLogo: a sequence logo generator.WebLogo:一个序列图生成器。
Genome Res. 2004 Jun;14(6):1188-90. doi: 10.1101/gr.849004.
5
Constrained binding site diversity within families of transcription factors enhances pattern discovery bioinformatics.转录因子家族内受限的结合位点多样性增强了模式发现生物信息学。
J Mol Biol. 2004 Apr 23;338(2):207-15. doi: 10.1016/j.jmb.2004.02.048.
6
Local feature frequency profile: a method to measure structural similarity in proteins.局部特征频率分布图:一种测量蛋白质结构相似性的方法。
Proc Natl Acad Sci U S A. 2004 Mar 16;101(11):3797-802. doi: 10.1073/pnas.0308656100. Epub 2004 Feb 25.
7
JASPAR: an open-access database for eukaryotic transcription factor binding profiles.JASPAR:一个用于真核转录因子结合图谱的开放获取数据库。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D91-4. doi: 10.1093/nar/gkh012.
8
Combining phylogenetic data with co-regulated genes to identify regulatory motifs.结合系统发育数据与共调控基因以识别调控基序。
Bioinformatics. 2003 Dec 12;19(18):2369-80. doi: 10.1093/bioinformatics/btg329.
9
Computational detection of cis -regulatory modules.顺式调控模块的计算检测
Bioinformatics. 2003 Oct;19 Suppl 2:ii5-14. doi: 10.1093/bioinformatics/btg1052.
10
Assembly of cell regulatory systems through protein interaction domains.通过蛋白质相互作用结构域组装细胞调节系统。
Science. 2003 Apr 18;300(5618):445-52. doi: 10.1126/science.1083653.