Mboning Lajoyce, Costa Emma K, Chen Jingxun, Bouchard Louis-S, Pellegrini Matteo
Department of Chemistry and Biochemistry, University of California, Los Angeles, Los Angeles, California, United States.
Department of Neurology and Neurological Sciences, Stanford University, Palo Alto, California, United States.
bioRxiv. 2024 Sep 19:2024.09.16.613354. doi: 10.1101/2024.09.16.613354.
Aging is a complex biological process influenced by various factors, including genetic and environmental influences. In this study, we present BayesAge 2.0, an improved version of our maximum likelihood algorithm designed for predicting transcriptomic age (tAge) from RNA-seq data. Building on the original BayesAge framework, which was developed for epigenetic age prediction, BayesAge 2.0 integrates a Poisson distribution to model count-based gene expression data and employs LOWESS smoothing to capture non-linear gene-age relationships. BayesAge 2.0 provides significant improvements over traditional linear models, such as Elastic Net regression. Specifically, it addresses issues of age bias in predictions, with minimal age-associated bias observed in residuals. Its computational efficiency further distinguishes it from traditional models, as reference construction and cross-validation are completed more quickly compared to Elastic Net regression, which requires extensive hyperparameter tuning. Overall, BayesAge 2.0 represents a notable advance in transcriptomic age prediction, offering a robust, accurate, and efficient tool for aging research and biomarker development.
衰老 是 一个 受 多种 因素 影响 的 复杂 生物学 过程, 包括 遗传 和 环境 影响。 在 本 研究 中, 我们 展示 了 BayesAge 2.0, 这 是 我们 为 从 RNA 测序 数据 预测 转录组 年龄(tAge) 而 设计 的 最大 似然 算法 的 改进 版本。 在 最初 为 表观遗传 年龄 预测 而 开发 的 BayesAge 框架 的 基础 上,BayesAge 2.0 整合 了 泊松 分布 以 对 基于 计数 的 基因 表达 数据 进行 建模, 并 采用 LOWESS 平滑 来 捕捉 非线性 基因 - 年龄 关系。 BayesAge 2.0 相对于 传统 线性 模型( 如 弹性 网络 回归) 有 显著 改进。 具体 而言, 它 解决 了 预测 中的 年龄 偏差 问题, 在 残差 中 观察 到 的 年龄 相关 偏差 最小。 其 计算 效率 进一步 将 它 与 传统 模型 区分 开来, 因为 与 需要 广泛 超参数 调整 的 弹性 网络 回归 相比, 参考 构建 和 交叉 验证 完成 得 更快。 总体 而言,BayesAge 2.0 代表 了 转录组 年龄 预测 方面 的 显著 进展, 为 衰老 研究 和 生物标志物 开发 提供 了 一个 强大、 准确 和 高效 的 工具。