• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BindVAE:可及染色质从头发现基序的 Dirichlet 变分自动编码器。

BindVAE: Dirichlet variational autoencoders for de novo motif discovery from accessible chromatin.

机构信息

Microsoft, AI for Good Research Lab, Redmond, WA, USA.

Calico Life Sciences, South San Francisco, CA, USA.

出版信息

Genome Biol. 2022 Aug 15;23(1):174. doi: 10.1186/s13059-022-02723-w.

DOI:10.1186/s13059-022-02723-w
PMID:35971180
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9380350/
Abstract

We present a novel unsupervised deep learning approach called BindVAE, based on Dirichlet variational autoencoders, for jointly decoding multiple TF binding signals from open chromatin regions. BindVAE can disentangle an input DNA sequence into distinct latent factors that encode cell-type specific in vivo binding signals for individual TFs, composite patterns for TFs involved in cooperative binding, and genomic context surrounding the binding sites. On the task of retrieving the motifs of expressed TFs in a given cell type, BindVAE is competitive with existing motif discovery approaches.

摘要

我们提出了一种新的无监督深度学习方法,称为 BindVAE,它基于狄利克雷变分自动编码器,用于从开放染色质区域联合解码多个 TF 结合信号。BindVAE 可以将输入的 DNA 序列分解为不同的潜在因子,这些因子分别对单个 TF 的细胞类型特异性体内结合信号、参与协同结合的 TF 的组合模式以及结合位点周围的基因组环境进行编码。在检索给定细胞类型中表达 TF 的基序的任务中,BindVAE 与现有的基序发现方法具有竞争力。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/f6fd44d4e152/13059_2022_2723_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/8517650b5f66/13059_2022_2723_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/72e0d4c05be9/13059_2022_2723_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/b50d62caeea6/13059_2022_2723_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/f6fd44d4e152/13059_2022_2723_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/8517650b5f66/13059_2022_2723_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/72e0d4c05be9/13059_2022_2723_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/b50d62caeea6/13059_2022_2723_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7d58/9380350/f6fd44d4e152/13059_2022_2723_Fig4_HTML.jpg

相似文献

1
BindVAE: Dirichlet variational autoencoders for de novo motif discovery from accessible chromatin.BindVAE:可及染色质从头发现基序的 Dirichlet 变分自动编码器。
Genome Biol. 2022 Aug 15;23(1):174. doi: 10.1186/s13059-022-02723-w.
2
Uncovering uncharacterized binding of transcription factors from ATAC-seq footprinting data.从ATAC-seq足迹数据中发现转录因子的未表征结合。
Sci Rep. 2024 Apr 23;14(1):9275. doi: 10.1038/s41598-024-59989-2.
3
Transcription factor-binding k-mer analysis clarifies the cell type dependency of binding specificities and cis-regulatory SNPs in humans.转录因子结合 k- -mer 分析阐明了人类结合特异性和顺式调控 SNP 的细胞类型依赖性。
BMC Genomics. 2023 Oct 7;24(1):597. doi: 10.1186/s12864-023-09692-9.
4
Sequence and chromatin determinants of cell-type-specific transcription factor binding.细胞类型特异性转录因子结合的序列和染色质决定因素。
Genome Res. 2012 Sep;22(9):1723-34. doi: 10.1101/gr.127712.111.
5
Sequence features and chromatin structure around the genomic regions bound by 119 human transcription factors.119 个人类转录因子结合的基因组区域的序列特征和染色质结构。
Genome Res. 2012 Sep;22(9):1798-812. doi: 10.1101/gr.139105.112.
6
SeqGL Identifies Context-Dependent Binding Signals in Genome-Wide Regulatory Element Maps.SeqGL在全基因组调控元件图谱中识别上下文相关的结合信号。
PLoS Comput Biol. 2015 May 27;11(5):e1004271. doi: 10.1371/journal.pcbi.1004271. eCollection 2015 May.
7
Improved linking of motifs to their TFs using domain information.利用域信息改进基序与其 TF 的关联。
Bioinformatics. 2020 Mar 1;36(6):1655-1662. doi: 10.1093/bioinformatics/btz855.
8
DeFCoM: analysis and modeling of transcription factor binding sites using a motif-centric genomic footprinter.DeFCoM:使用以基序为中心的基因组足迹法对转录因子结合位点进行分析和建模。
Bioinformatics. 2017 Apr 1;33(7):956-963. doi: 10.1093/bioinformatics/btw740.
9
MEDEA: analysis of transcription factor binding motifs in accessible chromatin.Medea:分析可及染色质中转录因子结合基序。
Genome Res. 2020 May;30(5):736-748. doi: 10.1101/gr.260877.120. Epub 2020 May 18.
10
A universal framework for detecting -regulatory diversity in DNA regions.用于检测 DNA 区域中的调控多样性的通用框架。
Genome Res. 2021 Sep;31(9):1646-1662. doi: 10.1101/gr.274563.120. Epub 2021 Jul 19.

引用本文的文献

1
-mer manifold approximation and projection for visualizing DNA sequences.用于可视化DNA序列的-mer流形逼近与投影
Genome Res. 2025 May 2;35(5):1234-1246. doi: 10.1101/gr.279458.124.
2
Deep topic modeling of spatial transcriptomics in the rheumatoid arthritis synovium identifies distinct classes of ectopic lymphoid structures.类风湿性关节炎滑膜组织中空间转录组学的深度主题建模识别出不同类别的异位淋巴结构。
bioRxiv. 2025 Jan 10:2025.01.08.631928. doi: 10.1101/2025.01.08.631928.
3
A single-cell multimodal view on gene regulatory network inference from transcriptomics and chromatin accessibility data.

本文引用的文献

1
Base-resolution models of transcription-factor binding reveal soft motif syntax.基于分辨率的转录因子结合模型揭示了软基序语法。
Nat Genet. 2021 Mar;53(3):354-366. doi: 10.1038/s41588-021-00782-6. Epub 2021 Feb 18.
2
DNABERT: pre-trained Bidirectional Encoder Representations from Transformers model for DNA-language in genome.DNABERT:用于基因组中DNA语言的基于变换器的预训练双向编码器表征模型。
Bioinformatics. 2021 Aug 9;37(15):2112-2120. doi: 10.1093/bioinformatics/btab083.
3
GkmExplain: fast and accurate interpretation of nonlinear gapped k-mer SVMs.
单细胞多模态视角下从转录组学和染色质可及性数据推断基因调控网络。
Brief Bioinform. 2024 Jul 25;25(5). doi: 10.1093/bib/bbae382.
4
Machine learning in biological physics: From biomolecular prediction to design.机器学习在生物物理学中的应用:从生物分子预测到设计。
Proc Natl Acad Sci U S A. 2024 Jul 2;121(27):e2311807121. doi: 10.1073/pnas.2311807121. Epub 2024 Jun 24.
5
Uncovering uncharacterized binding of transcription factors from ATAC-seq footprinting data.从ATAC-seq足迹数据中发现转录因子的未表征结合。
Sci Rep. 2024 Apr 23;14(1):9275. doi: 10.1038/s41598-024-59989-2.
6
JASPAR 2024: 20th anniversary of the open-access database of transcription factor binding profiles.JASPAR 2024:转录因子结合谱开放获取数据库的 20 周年纪念
Nucleic Acids Res. 2024 Jan 5;52(D1):D174-D182. doi: 10.1093/nar/gkad1059.
7
Predicting the impact of sequence motifs on gene regulation using single-cell data.使用单细胞数据预测序列基序对基因调控的影响。
Genome Biol. 2023 Aug 15;24(1):189. doi: 10.1186/s13059-023-03021-9.
GkmExplain:快速准确地解释非线性缺口 k-mer SVM。
Bioinformatics. 2019 Jul 15;35(14):i173-i182. doi: 10.1093/bioinformatics/btz322.
4
BindSpace decodes transcription factor binding signals by large-scale sequence embedding.BindSpace 通过大规模序列嵌入来解码转录因子结合信号。
Nat Methods. 2019 Sep;16(9):858-861. doi: 10.1038/s41592-019-0511-y. Epub 2019 Aug 12.
5
Dimensionality reduction for visualizing single-cell data using UMAP.使用UMAP进行单细胞数据可视化的降维方法。
Nat Biotechnol. 2018 Dec 3. doi: 10.1038/nbt.4314.
6
Sequential regulatory activity prediction across chromosomes with convolutional neural networks.基于卷积神经网络的跨染色体顺序调控活性预测
Genome Res. 2018 May;28(5):739-750. doi: 10.1101/gr.227819.117. Epub 2018 Mar 27.
7
Combinatorial bZIP dimers display complex DNA-binding specificity landscapes.组合型bZIP二聚体呈现出复杂的DNA结合特异性图谱。
Elife. 2017 Feb 10;6:e19272. doi: 10.7554/eLife.19272.
8
Transcription factor family-specific DNA shape readout revealed by quantitative specificity models.通过定量特异性模型揭示的转录因子家族特异性DNA形状读出
Mol Syst Biol. 2017 Feb 6;13(2):910. doi: 10.15252/msb.20167238.
9
Modular combinatorial binding among human trans-acting factors reveals direct and indirect factor binding.人类反式作用因子之间的模块化组合结合揭示了直接和间接因子结合。
BMC Genomics. 2017 Jan 6;18(1):45. doi: 10.1186/s12864-016-3434-3.
10
Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks.巴塞特:利用深度卷积神经网络学习可及基因组的调控密码。
Genome Res. 2016 Jul;26(7):990-9. doi: 10.1101/gr.200535.115. Epub 2016 May 3.