• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

经典 DNA 基序发现工具在合成数据上的比较基准。

A comparative benchmark of classic DNA motif discovery tools on synthetic data.

机构信息

Bioinformatics Unit, IRCCS Casa Sollievo della Sofferenza, S. Giovanni Rotondo 71013, Italy.

Department of Experimental Medicine, Sapienza University of Rome, Rome 00161, Italy.

出版信息

Brief Bioinform. 2021 Nov 5;22(6). doi: 10.1093/bib/bbab303.

DOI:10.1093/bib/bbab303
PMID:34351399
Abstract

Hundreds of human proteins were found to establish transient interactions with rather degenerated consensus DNA sequences or motifs. Identifying these motifs and the genomic sites where interactions occur represent one of the most challenging research goals in modern molecular biology and bioinformatics. The last twenty years witnessed an explosion of computational tools designed to perform this task, whose performance has been last compared fifteen years ago. Here, we survey sixteen of them, benchmark their ability to identify known motifs nested in twenty-nine simulated sequence datasets, and finally report their strengths, weaknesses, and complementarity.

摘要

数百个人类蛋白质被发现与相当退化的共识 DNA 序列或基序建立瞬时相互作用。识别这些基序和发生相互作用的基因组位点是现代分子生物学和生物信息学中最具挑战性的研究目标之一。在过去的二十年里,设计用于执行此任务的计算工具呈爆炸式增长,其性能在十五年前进行了最后一次比较。在这里,我们调查了其中的十六个,基准测试它们识别嵌套在二十九个模拟序列数据集中的已知基序的能力,最后报告它们的优点、缺点和互补性。

相似文献

1
A comparative benchmark of classic DNA motif discovery tools on synthetic data.经典 DNA 基序发现工具在合成数据上的比较基准。
Brief Bioinform. 2021 Nov 5;22(6). doi: 10.1093/bib/bbab303.
2
Classification and assessment tools for structural motif discovery algorithms.结构模体发现算法的分类和评估工具。
BMC Bioinformatics. 2013;14 Suppl 9(Suppl 9):S4. doi: 10.1186/1471-2105-14-S9-S4. Epub 2013 Jun 28.
3
Assessment of composite motif discovery methods.复合基序发现方法的评估。
BMC Bioinformatics. 2008 Feb 26;9:123. doi: 10.1186/1471-2105-9-123.
4
EMD: an ensemble algorithm for discovering regulatory motifs in DNA sequences.EMD:一种用于在DNA序列中发现调控基序的集成算法。
BMC Bioinformatics. 2006 Jul 13;7:342. doi: 10.1186/1471-2105-7-342.
5
Discovering sequence motifs.发现序列基序。
Methods Mol Biol. 2008;452:231-51. doi: 10.1007/978-1-60327-159-2_12.
6
Limitations and potentials of current motif discovery algorithms.当前基序发现算法的局限性与潜力。
Nucleic Acids Res. 2005 Sep 2;33(15):4899-913. doi: 10.1093/nar/gki791. Print 2005.
7
An intuitionistic approach to scoring DNA sequences against transcription factor binding site motifs.一种基于直觉的方法,用于对 DNA 序列进行评分,以对抗转录因子结合位点基序。
BMC Bioinformatics. 2010 Nov 8;11:551. doi: 10.1186/1471-2105-11-551.
8
Probabilistic models for semisupervised discriminative motif discovery in DNA sequences.用于 DNA 序列中半监督判别基序发现的概率模型。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Sep-Oct;8(5):1309-17. doi: 10.1109/TCBB.2010.84.
9
SCOPE: a web server for practical de novo motif discovery.SCOPE:用于实际从头基序发现的网络服务器。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W259-64. doi: 10.1093/nar/gkm310. Epub 2007 May 7.
10
Genomic variant benchmark: if you cannot measure it, you cannot improve it.基因组变异基准:如果无法衡量,就无法改进。
Genome Biol. 2023 Oct 5;24(1):221. doi: 10.1186/s13059-023-03061-1.

引用本文的文献

1
Benchmarking transcription factor binding site prediction models: a comparative analysis on synthetic and biological data.基准测试转录因子结合位点预测模型:对合成数据和生物数据的比较分析
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf363.
2
Cross-platform DNA motif discovery and benchmarking to explore binding specificities of poorly studied human transcription factors.跨平台DNA基序发现与基准测试,以探索研究较少的人类转录因子的结合特异性。
bioRxiv. 2024 Nov 13:2024.11.11.619379. doi: 10.1101/2024.11.11.619379.
3
Genomic background sequences systematically outperform synthetic ones in de novo motif discovery for ChIP-seq data.
在ChIP-seq数据的从头基序发现中,基因组背景序列在系统上优于合成序列。
NAR Genom Bioinform. 2024 Jul 27;6(3):lqae090. doi: 10.1093/nargab/lqae090. eCollection 2024 Sep.
4
A survey on algorithms to characterize transcription factor binding sites.一种用于刻画转录因子结合位点的算法研究综述。
Brief Bioinform. 2023 May 19;24(3). doi: 10.1093/bib/bbad156.
5
Deep Phenotyping of Chinese Electronic Health Records by Recognizing Linguistic Patterns of Phenotypic Narratives With a Sequence Motif Discovery Tool: Algorithm Development and Validation.利用序列基序发现工具识别表型叙述的语言模式对中国电子健康记录进行深度表型分析:算法开发与验证
J Med Internet Res. 2022 Jun 3;24(6):e37213. doi: 10.2196/37213.