• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

贝叶斯结构方程模型在多组学数据中的应用及在生物钟基因中的应用。

Bayesian structural equation modeling in multiple omics data with application to circadian genes.

机构信息

Early Clinical Development Oncology Statistics, Pfizer Inc., San Diego, CA 92121, USA.

Department of Statistics.

出版信息

Bioinformatics. 2020 Jul 1;36(13):3951-3958. doi: 10.1093/bioinformatics/btaa286.

DOI:10.1093/bioinformatics/btaa286
PMID:32369552
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7332567/
Abstract

MOTIVATION

It is well known that the integration among different data-sources is reliable because of its potential of unveiling new functionalities of the genomic expressions, which might be dormant in a single-source analysis. Moreover, different studies have justified the more powerful analyses of multi-platform data. Toward this, in this study, we consider the circadian genes' omics profile, such as copy number changes and RNA-sequence data along with their survival response. We develop a Bayesian structural equation modeling coupled with linear regressions and log normal accelerated failure-time regression to integrate the information between these two platforms to predict the survival of the subjects. We place conjugate priors on the regression parameters and derive the Gibbs sampler using the conditional distributions of them.

RESULTS

Our extensive simulation study shows that the integrative model provides a better fit to the data than its closest competitor. The analyses of glioblastoma cancer data and the breast cancer data from TCGA, the largest genomics and transcriptomics database, support our findings.

AVAILABILITY AND IMPLEMENTATION

The developed method is wrapped in R package available at https://github.com/MAITYA02/semmcmc.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

众所周知,不同数据源的整合是可靠的,因为它有可能揭示基因组表达的新功能,而这些功能在单一来源的分析中可能是休眠的。此外,不同的研究已经证明了多平台数据的更强大的分析。为此,在这项研究中,我们考虑了生物钟基因的组学特征,如拷贝数变化和 RNA 测序数据,以及它们的生存反应。我们开发了一种贝叶斯结构方程模型,结合线性回归和对数正态加速失效时间回归,以整合这两个平台之间的信息,从而预测受试者的生存情况。我们在回归参数上放置了共轭先验,并使用它们的条件分布来推导 Gibbs 抽样器。

结果

我们广泛的模拟研究表明,整合模型比其最接近的竞争对手提供了更好的拟合数据。对胶质母细胞瘤癌症数据和 TCGA(最大的基因组和转录组学数据库)的乳腺癌数据的分析支持了我们的发现。

可用性和实现

所开发的方法被包装在 R 包中,可在 https://github.com/MAITYA02/semmcmc 上获得。

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
Bayesian structural equation modeling in multiple omics data with application to circadian genes.贝叶斯结构方程模型在多组学数据中的应用及在生物钟基因中的应用。
Bioinformatics. 2020 Jul 1;36(13):3951-3958. doi: 10.1093/bioinformatics/btaa286.
2
Cancer driver gene discovery through an integrative genomics approach in a non-parametric Bayesian framework.在非参数贝叶斯框架下通过综合基因组学方法发现癌症驱动基因。
Bioinformatics. 2017 Feb 15;33(4):483-490. doi: 10.1093/bioinformatics/btw662.
3
ThetaMater: Bayesian estimation of population size parameter θ from genomic data.Thetamater:基于基因组数据贝叶斯估计群体大小参数θ。
Bioinformatics. 2018 Mar 15;34(6):1072-1073. doi: 10.1093/bioinformatics/btx733.
4
A Bayesian two-way latent structure model for genomic data integration reveals few pan-genomic cluster subtypes in a breast cancer cohort.贝叶斯双向潜在结构模型用于基因组数据整合,揭示乳腺癌队列中很少有泛基因组聚类亚型。
Bioinformatics. 2019 Dec 1;35(23):4886-4897. doi: 10.1093/bioinformatics/btz381.
5
Bayesian integrative model for multi-omics data with missingness.贝叶斯综合模型在多组学数据缺失中的应用。
Bioinformatics. 2018 Nov 15;34(22):3801-3808. doi: 10.1093/bioinformatics/bty775.
6
Circadian Gene Selection for Time-to-event Phenotype by Integrating CNV and RNAseq Data.通过整合CNV和RNAseq数据进行事件发生时间表型的昼夜节律基因选择
Chemometr Intell Lab Syst. 2021 May 15;212. doi: 10.1016/j.chemolab.2021.104276. Epub 2021 Mar 16.
7
iDINGO-integrative differential network analysis in genomics with Shiny application.iDINGO——基于 Shiny 应用的基因组学综合差异网络分析。
Bioinformatics. 2018 Apr 1;34(7):1243-1245. doi: 10.1093/bioinformatics/btx750.
8
Driver network as a biomarker: systematic integration and network modeling of multi-omics data to derive driver signaling pathways for drug combination prediction.驱动网络作为生物标志物:多组学数据的系统整合和网络建模,以推导出用于药物组合预测的驱动信号通路。
Bioinformatics. 2019 Oct 1;35(19):3709-3717. doi: 10.1093/bioinformatics/btz109.
9
Bayesian network-response regression.贝叶斯网络-响应回归。
Bioinformatics. 2017 Jun 15;33(12):1859-1866. doi: 10.1093/bioinformatics/btx050.
10
An R package VIGoR for joint estimation of multiple linear learners with variational Bayesian inference.一个用于使用变分贝叶斯推断联合估计多个线性学习者的 R 包 VIGoR。
Bioinformatics. 2022 Jun 13;38(12):3306-3309. doi: 10.1093/bioinformatics/btac328.

引用本文的文献

1
A clustering approach to integrative analyses of multiomic cancer data.一种用于多组学癌症数据综合分析的聚类方法。
J Appl Stat. 2024 Nov 29;52(8):1539-1560. doi: 10.1080/02664763.2024.2431742. eCollection 2025.
2
Network-based multi-omics integrative analysis methods in drug discovery: a systematic review.药物发现中基于网络的多组学整合分析方法:一项系统综述
BioData Min. 2025 Mar 28;18(1):27. doi: 10.1186/s13040-025-00442-z.
3
Application of Bayesian genomic prediction methods to genome-wide association analyses.贝叶斯基因组预测方法在全基因组关联分析中的应用。
Genet Sel Evol. 2022 May 13;54(1):31. doi: 10.1186/s12711-022-00724-8.
4
Circadian Gene Selection for Time-to-event Phenotype by Integrating CNV and RNAseq Data.通过整合CNV和RNAseq数据进行事件发生时间表型的昼夜节律基因选择
Chemometr Intell Lab Syst. 2021 May 15;212. doi: 10.1016/j.chemolab.2021.104276. Epub 2021 Mar 16.
5
The Application of Bayesian Methods in Cancer Prognosis and Prediction.贝叶斯方法在癌症预后和预测中的应用。
Cancer Genomics Proteomics. 2022 Jan-Feb;19(1):1-11. doi: 10.21873/cgp.20298.
6
Improving existing analysis pipeline to identify and analyze cancer driver genes using multi-omics data.改进现有的分析流程,利用多组学数据识别和分析癌症驱动基因。
Sci Rep. 2020 Nov 25;10(1):20521. doi: 10.1038/s41598-020-77318-1.

本文引用的文献

1
Efficient Estimation for Semiparametric Structural Equation Models With Censored Data.含删失数据的半参数结构方程模型的有效估计
J Am Stat Assoc. 2018;113(522):893-905. doi: 10.1080/01621459.2017.1299626. Epub 2018 Jun 6.
2
Cancer statistics, 2018.癌症统计数据,2018 年。
CA Cancer J Clin. 2018 Jan;68(1):7-30. doi: 10.3322/caac.21442. Epub 2018 Jan 4.
3
Integrated genomic analysis of biological gene sets with applications in lung cancer prognosis.生物基因集的综合基因组分析及其在肺癌预后中的应用
BMC Bioinformatics. 2017 Jul 11;18(1):336. doi: 10.1186/s12859-017-1737-2.
4
More Is Better: Recent Progress in Multi-Omics Data Integration Methods.越多越好:多组学数据整合方法的最新进展
Front Genet. 2017 Jun 16;8:84. doi: 10.3389/fgene.2017.00084. eCollection 2017.
5
TCGA2STAT: simple TCGA data access for integrated statistical analysis in R.TCGA2STAT:用于 R 中集成统计分析的简单 TCGA 数据访问。
Bioinformatics. 2016 Mar 15;32(6):952-4. doi: 10.1093/bioinformatics/btv677. Epub 2015 Nov 14.
6
Genetics of Circadian Rhythms.昼夜节律的遗传学
Sleep Med Clin. 2015 Dec;10(4):413-21. doi: 10.1016/j.jsmc.2015.08.007.
7
Data integration in the era of omics: current and future challenges.组学时代的数据整合:当前与未来的挑战
BMC Syst Biol. 2014;8 Suppl 2(Suppl 2):I1. doi: 10.1186/1752-0509-8-S2-I1. Epub 2014 Mar 13.
8
The Cancer Genome Atlas Pan-Cancer analysis project.癌症基因组图谱泛癌分析项目。
Nat Genet. 2013 Oct;45(10):1113-20. doi: 10.1038/ng.2764.
9
The circadian clock in cancer development and therapy.生物钟在癌症发生和治疗中的作用。
Prog Mol Biol Transl Sci. 2013;119:221-82. doi: 10.1016/B978-0-12-396971-2.00009-9.
10
iBAG: integrative Bayesian analysis of high-dimensional multiplatform genomics data.iBAG:高维多组学基因组数据的综合贝叶斯分析。
Bioinformatics. 2013 Jan 15;29(2):149-59. doi: 10.1093/bioinformatics/bts655. Epub 2012 Nov 9.