• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过使用辅助共数据从RNA测序数据中获得更好的诊断特征。

Better diagnostic signatures from RNAseq data through use of auxiliary co-data.

作者信息

Novianti Putri W, Snoek Barbara C, Wilting Saskia M, van de Wiel Mark A

机构信息

Department of Epidemiology and Biostatistics, VU University Medical Center, Amsterdam, The Netherlands.

Department of Pathology, VU University Medical Center, Amsterdam, The Netherlands.

出版信息

Bioinformatics. 2017 May 15;33(10):1572-1574. doi: 10.1093/bioinformatics/btw837.

DOI:10.1093/bioinformatics/btw837
PMID:28073760
Abstract

SUMMARY

Our aim is to improve omics based prediction and feature selection using multiple sources of auxiliary information: co-data. Adaptive group regularized ridge regression (GRridge) was proposed to achieve this by estimating additional group-based penalty parameters through an empirical Bayes method at a low computational cost. We illustrate the GRridge method and software on RNA sequencing datasets. The method boosts the performance of an ordinary ridge regression and outperforms other classifiers. Post-hoc feature selection maintains the predictive ability of the classifier with far fewer markers.

AVAILABILITY AND IMPLEMENTATION

GRridge is an R package that includes a vignette. It is freely available at ( https://bioconductor.org/packages/GRridge/ ). All information and R scripts used in this study, including those on retrieval and processing of the co-data, are available from http://github.com/markvdwiel/GRridgeCodata .

CONTACT

mark.vdwiel@vumc.nl.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

我们的目标是利用多种辅助信息源(共数据)改进基于组学的预测和特征选择。为此,我们提出了自适应组正则化岭回归(GRridge)方法,通过经验贝叶斯方法以较低的计算成本估计额外的基于组的惩罚参数。我们在RNA测序数据集上展示了GRridge方法和软件。该方法提高了普通岭回归的性能,并且优于其他分类器。事后特征选择使用少得多的标记物就能保持分类器的预测能力。

可用性与实现方式

GRridge是一个包含 vignette 的R包。可从(https://bioconductor.org/packages/GRridge/)免费获取。本研究中使用的所有信息和R脚本,包括那些关于共数据检索和处理的脚本,可从http://github.com/markvdwiel/GRridgeCodata获取。

联系方式

mark.vdwiel@vumc.nl。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
Better diagnostic signatures from RNAseq data through use of auxiliary co-data.通过使用辅助共数据从RNA测序数据中获得更好的诊断特征。
Bioinformatics. 2017 May 15;33(10):1572-1574. doi: 10.1093/bioinformatics/btw837.
2
Better prediction by use of co-data: adaptive group-regularized ridge regression.使用协数据进行更好的预测:自适应组正则化岭回归。
Stat Med. 2016 Feb 10;35(3):368-81. doi: 10.1002/sim.6732. Epub 2015 Sep 13.
3
A new approach to bias correction in RNA-Seq.一种 RNA-Seq 中偏倚校正的新方法。
Bioinformatics. 2012 Apr 1;28(7):921-8. doi: 10.1093/bioinformatics/bts055. Epub 2012 Jan 28.
4
schex avoids overplotting for large single-cell RNA-sequencing datasets.schex 避免在大型单细胞 RNA-seq 数据集上过度绘制。
Bioinformatics. 2020 Apr 1;36(7):2291-2292. doi: 10.1093/bioinformatics/btz907.
5
Global FDR control across multiple RNAseq experiments.跨多个 RNAseq 实验的全局 FDR 控制。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac718.
6
ANAQUIN: a software toolkit for the analysis of spike-in controls for next generation sequencing.ANAQUIN:用于下一代测序中掺入对照分析的软件工具包。
Bioinformatics. 2017 Jun 1;33(11):1723-1724. doi: 10.1093/bioinformatics/btx038.
7
DNAshapeR: an R/Bioconductor package for DNA shape prediction and feature encoding.DNAshapeR:一个用于DNA形状预测和特征编码的R/Bioconductor软件包。
Bioinformatics. 2016 Apr 15;32(8):1211-3. doi: 10.1093/bioinformatics/btv735. Epub 2015 Dec 14.
8
DaMiRseq-an R/Bioconductor package for data mining of RNA-Seq data: normalization, feature selection and classification.DaMiRseq-一个用于 RNA-Seq 数据挖掘的 R/Bioconductor 包:归一化、特征选择和分类。
Bioinformatics. 2018 Apr 15;34(8):1416-1418. doi: 10.1093/bioinformatics/btx795.
9
chimeraviz: a tool for visualizing chimeric RNA.嵌合 RNA 可视化工具
Bioinformatics. 2017 Sep 15;33(18):2954-2956. doi: 10.1093/bioinformatics/btx329.
10
Segway 2.0: Gaussian mixture models and minibatch training.赛格威 2.0:高斯混合模型和小批量训练。
Bioinformatics. 2018 Feb 15;34(4):669-671. doi: 10.1093/bioinformatics/btx603.

引用本文的文献

1
Evaluating Genetic Regulators of MicroRNAs Using Machine Learning Models.使用机器学习模型评估微小RNA的基因调控因子
Int J Mol Sci. 2025 Jun 16;26(12):5757. doi: 10.3390/ijms26125757.
2
A regularized Cox hierarchical model for incorporating annotation information in predictive omic studies.一种用于在预测性组学研究中纳入注释信息的正则化Cox层次模型。
BioData Min. 2024 Oct 24;17(1):44. doi: 10.1186/s13040-024-00398-6.
3
Fecal microbiota composition is a better predictor of recurrent Clostridioides difficile infection than clinical factors in a prospective, multicentre cohort study.
前瞻性多中心队列研究表明,粪便微生物组成是复发性艰难梭菌感染的更好预测因子,优于临床因素。
BMC Infect Dis. 2024 Jul 10;24(1):687. doi: 10.1186/s12879-024-09506-7.
4
A modeling framework for detecting and leveraging node-level information in Bayesian network inference.一种用于在贝叶斯网络推理中检测和利用节点级信息的建模框架。
Biostatistics. 2024 Dec 31;26(1). doi: 10.1093/biostatistics/kxae021.
5
Correlation Imputation for Single-Cell RNA-seq.单细胞 RNA-seq 的关联插补。
J Comput Biol. 2022 May;29(5):465-482. doi: 10.1089/cmb.2021.0403. Epub 2022 Mar 21.
6
A panel of DNA methylation markers for the classification of consensus molecular subtypes 2 and 3 in patients with colorectal cancer.用于结直肠癌患者共识分子亚型 2 和 3 分类的一组 DNA 甲基化标志物。
Mol Oncol. 2021 Dec;15(12):3348-3362. doi: 10.1002/1878-0261.13098. Epub 2021 Sep 30.
7
Flexible co-data learning for high-dimensional prediction.高维预测的灵活协同数据学习。
Stat Med. 2021 Nov 20;40(26):5910-5925. doi: 10.1002/sim.9162. Epub 2021 Aug 26.
8
Correlation Imputation in Single cell RNA-seq using Auxiliary Information and Ensemble Learning.利用辅助信息和集成学习进行单细胞RNA测序中的相关性插补
ACM BCB. 2020 Sep;2020. doi: 10.1145/3388440.3412462.
9
Learning from a lot: Empirical Bayes for high-dimensional model-based prediction.博采众长:基于高维模型预测的经验贝叶斯方法
Scand Stat Theory Appl. 2019 Mar;46(1):2-25. doi: 10.1111/sjos.12335. Epub 2018 Jun 1.
10
Genome-wide microRNA analysis of HPV-positive self-samples yields novel triage markers for early detection of cervical cancer.HPV 阳性自身样本的全基因组 microRNA 分析可为宫颈癌的早期检测提供新的分流标记物。
Int J Cancer. 2019 Jan 15;144(2):372-379. doi: 10.1002/ijc.31855. Epub 2018 Nov 4.