• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

机器学习揭示了大肠杆菌 Hi-C 矩阵中的固有结构模式,并预测了染色体动力学。

Machine learning unravels inherent structural patterns in Escherichia coli Hi-C matrices and predicts chromosome dynamics.

机构信息

Tata Institute of Fundamental Research Hyderabad, Telangana 500046, India.

出版信息

Nucleic Acids Res. 2024 Oct 14;52(18):10836-10849. doi: 10.1093/nar/gkae749.

DOI:10.1093/nar/gkae749
PMID:39217471
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11472170/
Abstract

High dimensional nature of the chromosomal conformation contact map ('Hi-C Map'), even for microscopically small bacterial cell, poses challenges for extracting meaningful information related to its complex organization. Here we first demonstrate that an artificial deep neural network-based machine-learnt (ML) low-dimensional representation of a recently reported Hi-C interaction map of archetypal bacteria Escherichia coli can decode crucial underlying structural pattern. The ML-derived representation of Hi-C map can automatically detect a set of spatially distinct domains across E. coli genome, sharing reminiscences of six putative macro-domains previously posited via recombination assay. Subsequently, a ML-generated model assimilates the intricate relationship between large array of Hi-C-derived chromosomal contact probabilities and respective diffusive dynamics of each individual chromosomal gene and identifies an optimal number of functionally important chromosomal contact-pairs that are majorly responsible for heterogenous, coordinate-dependent sub-diffusive motions of chromosomal loci. Finally, the ML models, trained on wild-type E. coli show-cased its predictive capabilities on mutant bacterial strains, shedding light on the structural and dynamic nuances of ΔMatP30MM and ΔMukBEF22MM chromosomes. Overall our results illuminate the power of ML techniques in unraveling the complex relationship between structure and dynamics of bacterial chromosomal loci, promising meaningful connections between ML-derived insights and biological phenomena.

摘要

高维的染色体构象接触图谱(“Hi-C 图谱”)性质,即使对于微观的细菌细胞,也给提取与其复杂组织相关的有意义信息带来了挑战。在这里,我们首先证明,基于人工深度神经网络的机器学习(ML)可以对最近报道的典型细菌大肠杆菌的 Hi-C 相互作用图谱进行低维表示,从而解码关键的潜在结构模式。ML 衍生的 Hi-C 图谱表示可以自动检测大肠杆菌基因组中一组空间上不同的区域,这些区域共享先前通过重组试验提出的六个假定的大型结构域的特征。随后,一个 ML 生成的模型综合了大量的 Hi-C 衍生的染色体接触概率与每个染色体基因的扩散动力学之间的复杂关系,并确定了一组功能上重要的染色体接触对的最佳数量,这些接触对主要负责染色体位置的异质、协调相关的亚扩散运动。最后,在野生型大肠杆菌上训练的 ML 模型展示了其在突变细菌株上的预测能力,揭示了ΔMatP30MM 和ΔMukBEF22MM 染色体的结构和动态细微差别。总的来说,我们的结果阐明了 ML 技术在揭示细菌染色体位置的结构和动力学之间复杂关系方面的强大功能,为 ML 衍生的见解与生物学现象之间的有意义联系铺平了道路。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/c8e9048acb52/gkae749fig7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/419bedf7f4be/gkae749figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/d802499fc870/gkae749fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/88824467515b/gkae749fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/d02549dde556/gkae749fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/92edfdf60525/gkae749fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/dc1a426a98fb/gkae749fig5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/314c09197d8d/gkae749fig6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/c8e9048acb52/gkae749fig7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/419bedf7f4be/gkae749figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/d802499fc870/gkae749fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/88824467515b/gkae749fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/d02549dde556/gkae749fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/92edfdf60525/gkae749fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/dc1a426a98fb/gkae749fig5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/314c09197d8d/gkae749fig6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ddd3/11472170/c8e9048acb52/gkae749fig7.jpg

相似文献

1
Machine learning unravels inherent structural patterns in Escherichia coli Hi-C matrices and predicts chromosome dynamics.机器学习揭示了大肠杆菌 Hi-C 矩阵中的固有结构模式,并预测了染色体动力学。
Nucleic Acids Res. 2024 Oct 14;52(18):10836-10849. doi: 10.1093/nar/gkae749.
2
Widespread Strain-Specific Distinctions in Chromosomal Binding Dynamics of a Highly Conserved Escherichia coli Transcription Factor.广泛存在于高度保守的大肠杆菌转录因子的染色体结合动力学中的菌株特异性差异。
mBio. 2020 Jun 23;11(3):e01058-20. doi: 10.1128/mBio.01058-20.
3
A Hi-C data-integrated model elucidates E. coli chromosome's multiscale organization at various replication stages.高分辨率染色体构象捕获数据整合模型阐释了大肠杆菌染色体在不同复制阶段的多种尺度的结构。
Nucleic Acids Res. 2021 Apr 6;49(6):3077-3091. doi: 10.1093/nar/gkab094.
4
Hi-C embedded polymer model of Escherichia coli reveals the origin of heterogeneous subdiffusion in chromosomal loci.高分辨率染色体构象捕获技术(Hi-C)嵌入高分子模型揭示大肠杆菌染色质位点非均质亚扩散的起源。
Phys Rev E. 2022 Jun;105(6-1):064402. doi: 10.1103/PhysRevE.105.064402.
5
Determination of the 3D Genome Organization of Bacteria Using Hi-C.使用Hi-C技术测定细菌的三维基因组组织
Methods Mol Biol. 2018;1837:3-18. doi: 10.1007/978-1-4939-8675-0_1.
6
Development of a Data-Driven Integrative Model of a Bacterial Chromosome.细菌染色体的一种数据驱动的综合模型的建立。
J Chem Theory Comput. 2024 Feb 27;20(4):1673-1688. doi: 10.1021/acs.jctc.3c00118. Epub 2023 Apr 21.
7
Can the protein occupancy landscape show the topologically isolated chromosomal domains in the E. coli genome?: An exciting prospect.蛋白质占据图谱能否揭示大肠杆菌基因组中拓扑学上孤立的染色体结构域?:一个令人兴奋的前景。
Mol Cell. 2009 Aug 14;35(3):255-6. doi: 10.1016/j.molcel.2009.07.019.
8
Processing and Analysis of Hi-C Data on Bacteria.细菌Hi-C数据的处理与分析
Methods Mol Biol. 2018;1837:19-31. doi: 10.1007/978-1-4939-8675-0_2.
9
A Well-Mixed E. coli Genome: Widespread Contacts Revealed by Tracking Mu Transposition.均匀混合的大肠杆菌基因组:通过跟踪 Mu 转座揭示广泛的接触。
Cell. 2020 Feb 20;180(4):703-716.e18. doi: 10.1016/j.cell.2020.01.031. Epub 2020 Feb 13.
10
Activity of MukBEF for chromosome management in and its inhibition by MatP.MukBEF在[具体情境]中对染色体管理的活性及其受MatP的抑制作用。
Elife. 2024 Feb 5;12:RP91185. doi: 10.7554/eLife.91185.

引用本文的文献

1
Accurate prediction of the kinetic sequence of physicochemical states using generative artificial intelligence.使用生成式人工智能准确预测物理化学状态的动力学序列。
Chem Sci. 2025 Apr 10. doi: 10.1039/d5sc00108k.
2
Protein translation can fluidize bacterial cytoplasm.蛋白质翻译可使细菌细胞质流化。
PNAS Nexus. 2024 Nov 22;3(12):pgae532. doi: 10.1093/pnasnexus/pgae532. eCollection 2024 Dec.

本文引用的文献

1
Predicting Dynamic Heterogeneity in Glass-Forming Liquids by Physics-Inspired Machine Learning.基于物理启发的机器学习预测玻璃形成液体的动力学异质性。
Phys Rev Lett. 2023 Jun 9;130(23):238202. doi: 10.1103/PhysRevLett.130.238202.
2
Development of a Data-Driven Integrative Model of a Bacterial Chromosome.细菌染色体的一种数据驱动的综合模型的建立。
J Chem Theory Comput. 2024 Feb 27;20(4):1673-1688. doi: 10.1021/acs.jctc.3c00118. Epub 2023 Apr 21.
3
Improving the prediction of glassy dynamics by pinpointing the local cage.通过精确定位局部笼,提高玻璃动力学的预测能力。
J Chem Phys. 2023 Apr 7;158(13):134512. doi: 10.1063/5.0144822.
4
BOTAN: BOnd TArgeting Network for prediction of slow glassy dynamics by machine learning relative motion.基于机器学习相对运动的玻恩靶点网络预测慢玻璃动力学
J Chem Phys. 2023 Feb 28;158(8):084503. doi: 10.1063/5.0129791.
5
Interpretation of organizational role of proteins on E. coli nucleoid via Hi-C integrated model.通过 Hi-C 整合模型解析大肠杆菌核小体上的蛋白质组织角色。
Biophys J. 2023 Jan 3;122(1):63-81. doi: 10.1016/j.bpj.2022.11.2938. Epub 2022 Nov 25.
6
Hi-C embedded polymer model of Escherichia coli reveals the origin of heterogeneous subdiffusion in chromosomal loci.高分辨率染色体构象捕获技术(Hi-C)嵌入高分子模型揭示大肠杆菌染色质位点非均质亚扩散的起源。
Phys Rev E. 2022 Jun;105(6-1):064402. doi: 10.1103/PhysRevE.105.064402.
7
Comparing machine learning techniques for predicting glassy dynamics.比较用于预测玻璃动力学的机器学习技术。
J Chem Phys. 2022 May 28;156(20):204503. doi: 10.1063/5.0088581.
8
Averaging Local Structure to Predict the Dynamic Propensity in Supercooled Liquids.平均局部结构以预测过冷液体中的动态倾向。
Phys Rev Lett. 2021 Aug 20;127(8):088007. doi: 10.1103/PhysRevLett.127.088007.
9
Learning the distribution of single-cell chromosome conformations in bacteria reveals emergent order across genomic scales.学习细菌中单细胞染色体构象的分布揭示了在基因组尺度上出现的有序性。
Nat Commun. 2021 Mar 30;12(1):1963. doi: 10.1038/s41467-021-22189-x.
10
A Hi-C data-integrated model elucidates E. coli chromosome's multiscale organization at various replication stages.高分辨率染色体构象捕获数据整合模型阐释了大肠杆菌染色体在不同复制阶段的多种尺度的结构。
Nucleic Acids Res. 2021 Apr 6;49(6):3077-3091. doi: 10.1093/nar/gkab094.