• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于表观基因组注释的基因组数据分析:从富集分析到机器学习。

Epigenomic annotation-based interpretation of genomic data: from enrichment analysis to machine learning.

机构信息

Department of Biostatistics, Virginia Commonwealth University, Richmond, VA 23298, USA.

出版信息

Bioinformatics. 2017 Oct 15;33(20):3323-3330. doi: 10.1093/bioinformatics/btx414.

DOI:10.1093/bioinformatics/btx414
PMID:29028263
Abstract

MOTIVATION

One of the goals of functional genomics is to understand the regulatory implications of experimentally obtained genomic regions of interest (ROIs). Most sequencing technologies now generate ROIs distributed across the whole genome. The interpretation of these genome-wide ROIs represents a challenge as the majority of them lie outside of functionally well-defined protein coding regions. Recent efforts by the members of the International Human Epigenome Consortium have generated volumes of functional/regulatory data (reference epigenomic datasets), effectively annotating the genome with epigenomic properties. Consequently, a wide variety of computational tools has been developed utilizing these epigenomic datasets for the interpretation of genomic data.

RESULTS

The purpose of this review is to provide a structured overview of practical solutions for the interpretation of ROIs with the help of epigenomic data. Starting with epigenomic enrichment analysis, we discuss leading tools and machine learning methods utilizing epigenomic and 3D genome structure data. The hierarchy of tools and methods reviewed here presents a practical guide for the interpretation of genome-wide ROIs within an epigenomic context.

CONTACT

mikhail.dozmorov@vcuhealth.org.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

功能基因组学的目标之一是了解实验获得的基因组感兴趣区域 (ROI) 的调控含义。大多数测序技术现在生成分布在整个基因组中的 ROI。由于大多数 ROI 位于功能明确的蛋白编码区域之外,因此对这些全基因组 ROI 的解释是一个挑战。国际人类表观基因组联合会成员最近的努力已经产生了大量的功能/调控数据(参考表观基因组数据集),有效地利用表观基因组特性对基因组进行注释。因此,已经开发了各种各样的计算工具,利用这些表观基因组数据集来解释基因组数据。

结果

本综述的目的是提供一个结构化的概述,介绍在表观基因组数据的帮助下解释 ROI 的实用解决方案。从表观基因组富集分析开始,我们讨论了利用表观基因组和 3D 基因组结构数据的领先工具和机器学习方法。这里回顾的工具和方法层次结构为在表观基因组背景下解释全基因组 ROI 提供了实用指南。

联系方式

mikhail.dozmorov@vcuhealth.org.

补充信息

补充数据可在“Bioinformatics”在线获取。

相似文献

1
Epigenomic annotation-based interpretation of genomic data: from enrichment analysis to machine learning.基于表观基因组注释的基因组数据分析:从富集分析到机器学习。
Bioinformatics. 2017 Oct 15;33(20):3323-3330. doi: 10.1093/bioinformatics/btx414.
2
EpiCompare: an online tool to define and explore genomic regions with tissue or cell type-specific epigenomic features.EpiCompare:一个在线工具,用于定义和探索具有组织或细胞类型特异性表观基因组特征的基因组区域。
Bioinformatics. 2017 Oct 15;33(20):3268-3275. doi: 10.1093/bioinformatics/btx371.
3
GLANET: genomic loci annotation and enrichment tool.GLANET:基因组位点注释和富集工具。
Bioinformatics. 2017 Sep 15;33(18):2818-2828. doi: 10.1093/bioinformatics/btx326.
4
The epiGenomic Efficient Correlator (epiGeEC) tool allows fast comparison of user datasets with thousands of public epigenomic datasets. epiGeEC 工具允许用户快速比较数据集与数千个公共表观基因组数据集。
Bioinformatics. 2019 Feb 15;35(4):674-676. doi: 10.1093/bioinformatics/bty655.
5
Exploring Epigenomic Datasets by ChIPseeker.通过 ChIPseeker 探索表观基因组数据集。
Curr Protoc. 2022 Oct;2(10):e585. doi: 10.1002/cpz1.585.
6
AIKYATAN: mapping distal regulatory elements using convolutional learning on GPU.AIKYATAN:使用 GPU 上的卷积学习进行远端调控元件的作图。
BMC Bioinformatics. 2019 Oct 7;20(1):488. doi: 10.1186/s12859-019-3049-1.
7
An evaluation of noncoding genome annotation tools through enrichment analysis of 15 genome-wide association studies.通过对 15 项全基因组关联研究的富集分析来评估非编码基因组注释工具。
Brief Bioinform. 2019 May 21;20(3):995-1003. doi: 10.1093/bib/bbx131.
8
StereoGene: rapid estimation of genome-wide correlation of continuous or interval feature data.StereoGene:快速估计连续或区间特征数据的全基因组相关性。
Bioinformatics. 2017 Oct 15;33(20):3158-3165. doi: 10.1093/bioinformatics/btx379.
9
Development and application of an integrated allele-specific pipeline for methylomic and epigenomic analysis (MEA).开发和应用甲基化组学和表观基因组学分析(MEA)的综合等位基因特异性管道。
BMC Genomics. 2018 Jun 15;19(1):463. doi: 10.1186/s12864-018-4835-2.
10
Continuous chromatin state feature annotation of the human epigenome.人类表观基因组的连续染色质状态特征注释。
Bioinformatics. 2022 May 26;38(11):3029-3036. doi: 10.1093/bioinformatics/btac283.

引用本文的文献

1
Machine and Deep Learning Methods for Predicting 3D Genome Organization.机器和深度学习方法预测三维基因组结构。
Methods Mol Biol. 2025;2856:357-400. doi: 10.1007/978-1-0716-4136-1_22.
2
Methods for evaluating unsupervised vector representations of genomic regions.评估基因组区域无监督向量表示的方法。
NAR Genom Bioinform. 2024 Aug 10;6(3):lqae086. doi: 10.1093/nargab/lqae086. eCollection 2024 Sep.
3
Joint Representation Learning for Retrieval and Annotation of Genomic Interval Sets.用于基因组区间集检索和注释的联合表示学习
Bioengineering (Basel). 2024 Mar 8;11(3):263. doi: 10.3390/bioengineering11030263.
4
Machine and deep learning methods for predicting 3D genome organization.用于预测三维基因组组织的机器学习和深度学习方法。
ArXiv. 2024 Mar 4:arXiv:2403.03231v1.
5
RgnTX: Colocalization analysis of transcriptome elements in the presence of isoform heterogeneity and ambiguity.RgnTX:存在异构体异质性和模糊性时转录组元件的共定位分析。
Comput Struct Biotechnol J. 2023 Aug 24;21:4110-4117. doi: 10.1016/j.csbj.2023.08.021. eCollection 2023.
6
Markov chains improve the significance computation of overlapping genome annotations.马尔可夫链提高重叠基因组注释的显著性计算。
Bioinformatics. 2022 Jun 24;38(Suppl 1):i203-i211. doi: 10.1093/bioinformatics/btac255.
7
Leveraging histone modifications to improve genome annotations.利用组蛋白修饰来改进基因组注释。
G3 (Bethesda). 2021 Sep 27;11(10). doi: 10.1093/g3journal/jkab263.
8
clusterProfiler 4.0: A universal enrichment tool for interpreting omics data.clusterProfiler 4.0:用于解释组学数据的通用富集工具。
Innovation (Camb). 2021 Jul 1;2(3):100141. doi: 10.1016/j.xinn.2021.100141. eCollection 2021 Aug 28.
9
Whole-genome association analyses of sleep-disordered breathing phenotypes in the NHLBI TOPMed program.全基因组关联分析 NHLBI TOPMed 计划中睡眠呼吸紊乱表型。
Genome Med. 2021 Aug 26;13(1):136. doi: 10.1186/s13073-021-00917-8.
10
Bedshift: perturbation of genomic interval sets.床位调整:基因组区间集的扰动。
Genome Biol. 2021 Aug 20;22(1):238. doi: 10.1186/s13059-021-02440-w.