• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

DECOD:快速且准确的判别式 DNA 基序发现。

DECOD: fast and accurate discriminative DNA motif finding.

机构信息

Lane Center for Computational Biology, School of Computer Science, Carnegie Mellon University, Pittsburgh, PA 15213, USA.

出版信息

Bioinformatics. 2011 Sep 1;27(17):2361-7. doi: 10.1093/bioinformatics/btr412. Epub 2011 Jul 12.

DOI:10.1093/bioinformatics/btr412
PMID:21752801
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3157928/
Abstract

MOTIVATION

Motif discovery is now routinely used in high-throughput studies including large-scale sequencing and proteomics. These datasets present new challenges. The first is speed. Many motif discovery methods do not scale well to large datasets. Another issue is identifying discriminative rather than generative motifs. Such discriminative motifs are important for identifying co-factors and for explaining changes in behavior between different conditions.

RESULTS

To address these issues we developed a method for DECOnvolved Discriminative motif discovery (DECOD). DECOD uses a k-mer count table and so its running time is independent of the size of the input set. By deconvolving the k-mers DECOD considers context information without using the sequences directly. DECOD outperforms previous methods both in speed and in accuracy when using simulated and real biological benchmark data. We performed new binding experiments for p53 mutants and used DECOD to identify p53 co-factors, suggesting new mechanisms for p53 activation.

AVAILABILITY

The source code and binaries for DECOD are available at http://www.sb.cs.cmu.edu/DECOD CONTACT: zivbj@cs.cmu.edu

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

基序发现现在已被常规用于高通量研究,包括大规模测序和蛋白质组学。这些数据集提出了新的挑战。第一个是速度。许多基序发现方法不能很好地扩展到大型数据集。另一个问题是识别有区别的而不是生成的基序。这种有区别的基序对于识别共同因子以及解释不同条件下行为的变化很重要。

结果

为了解决这些问题,我们开发了一种用于 DECOnvolved Discriminative motif discovery(DECOD)的方法。DECOD 使用 k-mer 计数表,因此其运行时间与输入集的大小无关。通过对 k-mer 进行去卷积,DECOD 在不直接使用序列的情况下考虑上下文信息。在使用模拟和真实生物基准数据时,DECOD 在速度和准确性方面都优于以前的方法。我们对 p53 突变体进行了新的结合实验,并使用 DECOD 来识别 p53 共同因子,这为 p53 的激活提出了新的机制。

可用性

DECOD 的源代码和二进制文件可在 http://www.sb.cs.cmu.edu/DECOD 上获得。

联系人

zivbj@cs.cmu.edu

补充信息

补充数据可在Bioinformatics 在线获得。

相似文献

1
DECOD: fast and accurate discriminative DNA motif finding.DECOD:快速且准确的判别式 DNA 基序发现。
Bioinformatics. 2011 Sep 1;27(17):2361-7. doi: 10.1093/bioinformatics/btr412. Epub 2011 Jul 12.
2
Discriminative motif discovery in DNA and protein sequences using the DEME algorithm.使用DEME算法在DNA和蛋白质序列中发现鉴别性基序。
BMC Bioinformatics. 2007 Oct 15;8:385. doi: 10.1186/1471-2105-8-385.
3
WSMD: weakly-supervised motif discovery in transcription factor ChIP-seq data.WSMD:在转录因子 ChIP-seq 数据中进行弱监督基序发现。
Sci Rep. 2017 Jun 12;7(1):3217. doi: 10.1038/s41598-017-03554-7.
4
DISCOVER: a feature-based discriminative method for motif search in complex genomes.DISCOVER:一种用于在复杂基因组中进行基序搜索的基于特征的判别方法。
Bioinformatics. 2009 Jun 15;25(12):i321-9. doi: 10.1093/bioinformatics/btp230.
5
Poly(A) motif prediction using spectral latent features from human DNA sequences.基于人类 DNA 序列的谱潜在特征进行 Poly(A) 基序预测。
Bioinformatics. 2013 Jul 1;29(13):i316-25. doi: 10.1093/bioinformatics/btt218.
6
STREME: accurate and versatile sequence motif discovery.STREME:准确且通用的序列基序发现。
Bioinformatics. 2021 Sep 29;37(18):2834-2840. doi: 10.1093/bioinformatics/btab203.
7
Finding de novo methylated DNA motifs.发现从头甲基化 DNA 基序。
Bioinformatics. 2019 Sep 15;35(18):3287-3293. doi: 10.1093/bioinformatics/btz079.
8
TrawlerWeb: an online de novo motif discovery tool for next-generation sequencing datasets.拖网生物:下一代测序数据集的在线从头基序发现工具。
BMC Genomics. 2018 Apr 5;19(1):238. doi: 10.1186/s12864-018-4630-0.
9
Probabilistic models for semisupervised discriminative motif discovery in DNA sequences.用于 DNA 序列中半监督判别基序发现的概率模型。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Sep-Oct;8(5):1309-17. doi: 10.1109/TCBB.2010.84.
10
Discriminative motif analysis of high-throughput dataset.高通量数据集的判别基序分析。
Bioinformatics. 2014 Mar 15;30(6):775-83. doi: 10.1093/bioinformatics/btt615. Epub 2013 Oct 25.

引用本文的文献

1
Efficient Storage and Analysis of Genomic Data: A k-mer Frequency Mapping and Image Representation Method.基因组数据的高效存储与分析:一种k-mer频率映射与图像表示方法。
Interdiscip Sci. 2024 Oct 21. doi: 10.1007/s12539-024-00659-2.
2
The grapevine (Vitis vinifera L.) floral transcriptome in Pinot noir variety: identification of tissue-related gene networks and whorl-specific markers in pre- and post-anthesis phases.黑皮诺品种葡萄(Vitis vinifera L.)的花转录组:花期前后阶段组织相关基因网络和轮状特异性标记的鉴定
Hortic Res. 2021 Sep 1;8(1):200. doi: 10.1038/s41438-021-00635-7.
3
Differential gene expression identifies a transcriptional regulatory network involving ER-alpha and PITX1 in invasive epithelial ovarian cancer.差异基因表达鉴定涉及 ER-α和 PITX1 的侵袭性上皮性卵巢癌的转录调控网络。
BMC Cancer. 2021 Jul 3;21(1):768. doi: 10.1186/s12885-021-08276-8.
4
Identification of Cis-Regulatory Sequences Controlling Pollen-Specific Expression of Hydroxyproline-Rich Glycoprotein Genes in .鉴定控制[植物名称]中富含羟脯氨酸糖蛋白基因花粉特异性表达的顺式调控序列。 (注:原文中“in.”后面缺少具体植物名称等关键信息,翻译时做了适当补充以使句子完整表意)
Plants (Basel). 2020 Dec 10;9(12):1751. doi: 10.3390/plants9121751.
5
Prediction pipeline for discovery of regulatory motifs associated with Brugia malayi molting.与丝虫属马来丝虫蜕皮相关的调控基序的发现预测流程。
PLoS Negl Trop Dis. 2020 Jun 23;14(6):e0008275. doi: 10.1371/journal.pntd.0008275. eCollection 2020 Jun.
6
Sex chromosome evolution in parasitic nematodes of humans.人类寄生线虫的性染色体进化。
Nat Commun. 2020 Apr 23;11(1):1964. doi: 10.1038/s41467-020-15654-6.
7
Set cover-based methods for motif selection.基于集合覆盖的 motif 选择方法。
Bioinformatics. 2020 Feb 15;36(4):1044-1051. doi: 10.1093/bioinformatics/btz697.
8
ProSampler: an ultrafast and accurate motif finder in large ChIP-seq datasets for combinatory motif discovery.ProSampler:一种在大型 ChIP-seq 数据集中用于组合基序发现的超快速和准确的基序查找器。
Bioinformatics. 2019 Nov 1;35(22):4632-4639. doi: 10.1093/bioinformatics/btz290.
9
FisherMP: fully parallel algorithm for detecting combinatorial motifs from large ChIP-seq datasets.FisherMP:一种用于从大型 ChIP-seq 数据集中检测组合基序的完全并行算法。
DNA Res. 2019 Jun 1;26(3):231-242. doi: 10.1093/dnares/dsz004.
10
SArKS: de novo discovery of gene expression regulatory motif sites and domains by suffix array kernel smoothing.SArKS:通过后缀数组核平滑进行基因表达调控基序位点和结构域的从头发现。
Bioinformatics. 2019 Oct 15;35(20):3944-3952. doi: 10.1093/bioinformatics/btz198.

本文引用的文献

1
Identification of context-dependent motifs by contrasting ChIP binding data.通过对比 ChIP 结合数据鉴定上下文相关基序。
Bioinformatics. 2010 Nov 15;26(22):2826-32. doi: 10.1093/bioinformatics/btq546. Epub 2010 Sep 23.
2
Collection and motif-based prediction of phosphorylation sites in human viruses.基于收集和模体的人类病毒磷酸化位点预测。
Sci Signal. 2010 Aug 31;3(137):rs2. doi: 10.1126/scisignal.2001099.
3
A network of conserved co-occurring motifs for the regulation of alternative splicing.调控选择性剪接的保守共发生基序网络。
Nucleic Acids Res. 2010 Dec;38(22):7916-26. doi: 10.1093/nar/gkq705. Epub 2010 Aug 11.
4
On the detection and refinement of transcription factor binding sites using ChIP-Seq data.利用 ChIP-Seq 数据检测和改进转录因子结合位点。
Nucleic Acids Res. 2010 Apr;38(7):2154-67. doi: 10.1093/nar/gkp1180. Epub 2010 Jan 6.
5
Insights into GATA-1-mediated gene activation versus repression via genome-wide chromatin occupancy analysis.通过全基因组染色质占据分析深入了解GATA-1介导的基因激活与抑制。
Mol Cell. 2009 Nov 25;36(4):682-95. doi: 10.1016/j.molcel.2009.11.002.
6
Modes of p53 regulation.p53的调控模式。
Cell. 2009 May 15;137(4):609-22. doi: 10.1016/j.cell.2009.04.050.
7
Induction of SOX4 by DNA damage is critical for p53 stabilization and function.DNA损伤诱导SOX4对于p53的稳定和功能至关重要。
Proc Natl Acad Sci U S A. 2009 Mar 10;106(10):3788-93. doi: 10.1073/pnas.0810147106. Epub 2009 Feb 20.
8
Chromatin immunoprecipitation-on-chip reveals stress-dependent p53 occupancy in primary normal cells but not in established cell lines.芯片染色质免疫沉淀技术揭示了应激依赖性p53在原代正常细胞中的占据情况,但在已建立的细胞系中未发现这种情况。
Cancer Res. 2008 Dec 1;68(23):9671-7. doi: 10.1158/0008-5472.CAN-08-0865.
9
Seeder: discriminative seeding DNA motif discovery.播种器:鉴别性播种DNA基序发现
Bioinformatics. 2008 Oct 15;24(20):2303-7. doi: 10.1093/bioinformatics/btn444. Epub 2008 Aug 21.
10
Transcriptional control of human p53-regulated genes.人类p53调控基因的转录控制
Nat Rev Mol Cell Biol. 2008 May;9(5):402-12. doi: 10.1038/nrm2395.