• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

最优贝叶斯滤波在生物标志物发现中的应用:性能与稳健性。

Optimal Bayesian Filtering for Biomarker Discovery: Performance and Robustness.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2020 Jan-Feb;17(1):250-263. doi: 10.1109/TCBB.2018.2858814. Epub 2018 Jul 23.

DOI:10.1109/TCBB.2018.2858814
PMID:30040658
Abstract

Optimal Bayesian feature filtering (OBF) is a fast and memory-efficient algorithm that optimally identifies markers with distributional differences between treatment groups under Gaussian models. Here, we study the performance and robustness of OBF for biomarker discovery. Our contributions are twofold: (1) we examine how OBF performs on data that violates modeling assumptions, and (2) we provide guidelines on how to set input parameters for robust performance. Contribution (1) addresses an important, relevant, and commonplace problem in computational biology, where it is often impossible to validate an algorithm's core assumptions. To accomplish both tasks, we present a battery of simulations that implement OBF with different inputs and challenge each assumption made by OBF. In particular, we examine the robustness of OBF with respect to incorrect input parameters, false independence, imbalanced sample size, and we address the Gaussianity assumption by considering performance on an extensive family of non-Gaussian distributions. We address advantages and disadvantages between different priors and optimization criteria throughout. Finally, we evaluate the utility of OBF in biomarker discovery using acute myeloid leukemia (AML) and colon cancer microarray datasets, and show that OBF is successful at identifying well-known biomarkers for these diseases that rank low under moderated t-test.

摘要

最优贝叶斯特征过滤 (OBF) 是一种快速且内存高效的算法,它可以在高斯模型下优化识别治疗组之间具有分布差异的标志物。在这里,我们研究了 OBF 在生物标志物发现中的性能和鲁棒性。我们的贡献有两点:(1) 我们研究了 OBF 在违反建模假设的数据上的表现,(2) 我们提供了有关如何设置输入参数以实现稳健性能的指南。贡献 (1) 解决了计算生物学中一个重要、相关且常见的问题,即通常不可能验证算法的核心假设。为了完成这两个任务,我们提出了一系列模拟,这些模拟使用不同的输入实现了 OBF,并对 OBF 做出的每个假设进行了挑战。特别是,我们研究了 OBF 对错误输入参数、虚假独立性、不平衡样本大小的鲁棒性,并通过考虑广泛的非高斯分布族的性能来解决高斯性假设。我们在整个过程中讨论了不同先验和优化标准之间的优缺点。最后,我们使用急性髓性白血病 (AML) 和结肠癌微阵列数据集评估了 OBF 在生物标志物发现中的效用,并表明 OBF 成功地识别了这些疾病的知名生物标志物,这些标志物在适度 t 检验下排名较低。

相似文献

1
Optimal Bayesian Filtering for Biomarker Discovery: Performance and Robustness.最优贝叶斯滤波在生物标志物发现中的应用:性能与稳健性。
IEEE/ACM Trans Comput Biol Bioinform. 2020 Jan-Feb;17(1):250-263. doi: 10.1109/TCBB.2018.2858814. Epub 2018 Jul 23.
2
Robust biomarker identification for cancer diagnosis with ensemble feature selection methods.基于集成特征选择方法的癌症诊断稳健生物标志物识别。
Bioinformatics. 2010 Feb 1;26(3):392-8. doi: 10.1093/bioinformatics/btp630. Epub 2009 Nov 25.
3
Heuristic algorithms for feature selection under Bayesian models with block-diagonal covariance structure.启发式算法在具有块对角协方差结构的贝叶斯模型下的特征选择。
BMC Bioinformatics. 2018 Mar 21;19(Suppl 3):70. doi: 10.1186/s12859-018-2059-8.
4
Robustness of chemometrics-based feature selection methods in early cancer detection and biomarker discovery.基于化学计量学的特征选择方法在早期癌症检测和生物标志物发现中的稳健性。
Stat Appl Genet Mol Biol. 2013 Mar 13;12(2):207-23. doi: 10.1515/sagmb-2012-0067.
5
Bayesian Regression with Network Prior: Optimal Bayesian Filtering Perspective.具有网络先验的贝叶斯回归:最优贝叶斯滤波视角
IEEE Trans Signal Process. 2016 Dec 1;64(23):6243-6253. doi: 10.1109/TSP.2016.2605072. Epub 2016 Sep 1.
6
Application of the Bayesian MMSE estimator for classification error to gene expression microarray data.贝叶斯 MMSE 估计器在基因表达微阵列数据分类误差中的应用。
Bioinformatics. 2011 Jul 1;27(13):1822-31. doi: 10.1093/bioinformatics/btr272. Epub 2011 May 5.
7
Robust modeling of differential gene expression data using normal/independent distributions: a Bayesian approach.使用正态/独立分布对差异基因表达数据进行稳健建模:一种贝叶斯方法。
PLoS One. 2015 Apr 24;10(4):e0123791. doi: 10.1371/journal.pone.0123791. eCollection 2015.
8
Subtype prediction in pediatric acute myeloid leukemia: classification using differential network rank conservation revisited.儿童急性髓系白血病的亚型预测:重新审视使用差异网络秩守恒的分类方法
BMC Bioinformatics. 2015 Sep 23;16:305. doi: 10.1186/s12859-015-0737-3.
9
Biomarker identification and cancer classification based on microarray data using Laplace naive Bayes model with mean shrinkage.基于微阵列数据的拉普拉斯朴素贝叶斯模型均值收缩的生物标志物识别和癌症分类。
IEEE/ACM Trans Comput Biol Bioinform. 2012 Nov-Dec;9(6):1649-62. doi: 10.1109/TCBB.2012.105.
10
EBADIMEX: an empirical Bayes approach to detect joint differential expression and methylation and to classify samples.EBADIMEX:一种用于检测联合差异表达和甲基化以及对样本进行分类的经验贝叶斯方法。
Stat Appl Genet Mol Biol. 2019 Nov 16;18(6):/j/sagmb.2019.18.issue-6/sagmb-2018-0050/sagmb-2018-0050.xml. doi: 10.1515/sagmb-2018-0050.

引用本文的文献

1
Deep learning features encode interpretable morphologies within histological images.深度学习特征在组织学图像中编码可解释的形态。
Sci Rep. 2022 Jun 8;12(1):9428. doi: 10.1038/s41598-022-13541-2.
2
High dimensional model representation of log-likelihood ratio: binary classification with expression data.对数似然比的高维模型表示:基于表达数据的二分类。
BMC Bioinformatics. 2020 Apr 25;21(1):156. doi: 10.1186/s12859-020-3486-x.