• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BOSO:一种用于高维数据线性回归的新型特征选择算法。

BOSO: A novel feature selection algorithm for linear regression with high-dimensional data.

机构信息

Universidad de Navarra, Tecnun Escuela de Ingeniería, San Sebastián, Spain.

Universidad de Navarra, CIMA Centro de Investigación de Medicina Aplicada, Pamplona, Spain.

出版信息

PLoS Comput Biol. 2022 May 31;18(5):e1010180. doi: 10.1371/journal.pcbi.1010180. eCollection 2022 May.

DOI:10.1371/journal.pcbi.1010180
PMID:35639775
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9187084/
Abstract

With the frenetic growth of high-dimensional datasets in different biomedical domains, there is an urgent need to develop predictive methods able to deal with this complexity. Feature selection is a relevant strategy in machine learning to address this challenge. We introduce a novel feature selection algorithm for linear regression called BOSO (Bilevel Optimization Selector Operator). We conducted a benchmark of BOSO with key algorithms in the literature, finding a superior accuracy for feature selection in high-dimensional datasets. Proof-of-concept of BOSO for predicting drug sensitivity in cancer is presented. A detailed analysis is carried out for methotrexate, a well-studied drug targeting cancer metabolism.

摘要

随着不同生物医学领域高维数据集的飞速增长,我们迫切需要开发能够应对这种复杂性的预测方法。特征选择是机器学习中应对这一挑战的一种相关策略。我们引入了一种新的线性回归特征选择算法,称为 BOSO(双层优化选择算子)。我们对 BOSO 与文献中的关键算法进行了基准测试,发现其在高维数据集中进行特征选择的准确性更高。我们还展示了 BOSO 用于预测癌症药物敏感性的概念验证。我们对甲氨蝶呤(一种针对癌症代谢的研究充分的药物)进行了详细分析。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/ccd3f747c5b8/pcbi.1010180.g007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/5264cb27557c/pcbi.1010180.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/164be90326fd/pcbi.1010180.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/888fe7e00cc7/pcbi.1010180.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/eeb7778ee447/pcbi.1010180.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/ca35ca98eb2c/pcbi.1010180.g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/f59fca78f85b/pcbi.1010180.g006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/ccd3f747c5b8/pcbi.1010180.g007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/5264cb27557c/pcbi.1010180.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/164be90326fd/pcbi.1010180.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/888fe7e00cc7/pcbi.1010180.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/eeb7778ee447/pcbi.1010180.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/ca35ca98eb2c/pcbi.1010180.g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/f59fca78f85b/pcbi.1010180.g006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/13a2/9187084/ccd3f747c5b8/pcbi.1010180.g007.jpg

相似文献

1
BOSO: A novel feature selection algorithm for linear regression with high-dimensional data.BOSO:一种用于高维数据线性回归的新型特征选择算法。
PLoS Comput Biol. 2022 May 31;18(5):e1010180. doi: 10.1371/journal.pcbi.1010180. eCollection 2022 May.
2
An Innovative Excited-ACS-IDGWO Algorithm for Optimal Biomedical Data Feature Selection.一种创新的基于激发 ACS-IDGWO 算法的最优生物医学数据特征选择方法。
Biomed Res Int. 2020 Aug 17;2020:8506365. doi: 10.1155/2020/8506365. eCollection 2020.
3
Top scoring pairs for feature selection in machine learning and applications to cancer outcome prediction.机器学习中特征选择的最佳评分对及其在癌症预后预测中的应用。
BMC Bioinformatics. 2011 Sep 23;12:375. doi: 10.1186/1471-2105-12-375.
4
Novel chaotic oppositional fruit fly optimization algorithm for feature selection applied on COVID 19 patients' health prediction.新型混沌反对派果蝇优化算法在 COVID-19 患者健康预测中的特征选择应用。
PLoS One. 2022 Oct 10;17(10):e0275727. doi: 10.1371/journal.pone.0275727. eCollection 2022.
5
The feature selection bias problem in relation to high-dimensional gene data.与高维基因数据相关的特征选择偏差问题。
Artif Intell Med. 2016 Jan;66:63-71. doi: 10.1016/j.artmed.2015.11.001. Epub 2015 Nov 14.
6
Overall Survival Prognostic Modelling of Non-small Cell Lung Cancer Patients Using Positron Emission Tomography/Computed Tomography Harmonised Radiomics Features: The Quest for the Optimal Machine Learning Algorithm.正电子发射断层扫描/计算机断层扫描调和放射组学特征预测非小细胞肺癌患者总生存期:最优机器学习算法的探索。
Clin Oncol (R Coll Radiol). 2022 Feb;34(2):114-127. doi: 10.1016/j.clon.2021.11.014. Epub 2021 Dec 3.
7
C-HMOSHSSA: Gene selection for cancer classification using multi-objective meta-heuristic and machine learning methods.C-HMOSHSSA:使用多目标元启发式和机器学习方法进行癌症分类的基因选择。
Comput Methods Programs Biomed. 2019 Sep;178:219-235. doi: 10.1016/j.cmpb.2019.06.029. Epub 2019 Jun 29.
8
Feature weight estimation for gene selection: a local hyperlinear learning approach.特征权重估计在基因选择中的应用:一种局部超线性学习方法。
BMC Bioinformatics. 2014 Mar 14;15:70. doi: 10.1186/1471-2105-15-70.
9
The effect of machine learning regression algorithms and sample size on individualized behavioral prediction with functional connectivity features.机器学习回归算法和样本量对功能连接特征的个体化行为预测的影响。
Neuroimage. 2018 Sep;178:622-637. doi: 10.1016/j.neuroimage.2018.06.001. Epub 2018 Jun 2.
10
Novel Improved Salp Swarm Algorithm: An Application for Feature Selection.新型改进沙蚕群算法:在特征选择中的应用。
Sensors (Basel). 2022 Feb 22;22(5):1711. doi: 10.3390/s22051711.

引用本文的文献

1
Precision oncology: a review to assess interpretability in several explainable methods.精准肿瘤学:评估几种可解释方法的可解释性的综述。
Brief Bioinform. 2023 Jul 20;24(4). doi: 10.1093/bib/bbad200.

本文引用的文献

1
Structured sparsity regularization for analyzing high-dimensional omics data.结构稀疏正则化分析高维组学数据。
Brief Bioinform. 2021 Jan 18;22(1):77-87. doi: 10.1093/bib/bbaa122.
2
GARS: Genetic Algorithm for the identification of a Robust Subset of features in high-dimensional datasets.GARS:用于在高维数据集中识别稳健特征子集的遗传算法。
BMC Bioinformatics. 2020 Feb 11;21(1):54. doi: 10.1186/s12859-020-3400-6.
3
Blood metabolome predicts gut microbiome α-diversity in humans.血液代谢组可预测人类肠道微生物组 α 多样性。
Nat Biotechnol. 2019 Oct;37(10):1217-1228. doi: 10.1038/s41587-019-0233-9. Epub 2019 Sep 2.
4
Next-generation characterization of the Cancer Cell Line Encyclopedia.下一代癌症细胞系百科全书的特征描述。
Nature. 2019 May;569(7757):503-508. doi: 10.1038/s41586-019-1186-3. Epub 2019 May 8.
5
Big data analytics for personalized medicine.大数据分析在个性化医疗中的应用。
Curr Opin Biotechnol. 2019 Aug;58:161-167. doi: 10.1016/j.copbio.2019.03.004. Epub 2019 Apr 6.
6
Architecture of gene regulatory networks controlling flower development in Arabidopsis thaliana.拟南芥花发育基因调控网络的结构。
Nat Commun. 2018 Oct 31;9(1):4534. doi: 10.1038/s41467-018-06772-3.
7
Functional genomic landscape of acute myeloid leukaemia.急性髓系白血病的功能基因组图谱。
Nature. 2018 Oct;562(7728):526-531. doi: 10.1038/s41586-018-0623-z. Epub 2018 Oct 17.
8
CUEDC1 is a primary target of ERα essential for the growth of breast cancer cells.CUEDC1 是 ERα 的主要靶标,对于乳腺癌细胞的生长至关重要。
Cancer Lett. 2018 Nov 1;436:87-95. doi: 10.1016/j.canlet.2018.08.018. Epub 2018 Aug 23.
9
mixOmics: An R package for 'omics feature selection and multiple data integration.mixOmics:一个用于“组学”特征选择和多数据整合的R包。
PLoS Comput Biol. 2017 Nov 3;13(11):e1005752. doi: 10.1371/journal.pcbi.1005752. eCollection 2017 Nov.
10
Targeting Metabolism for Cancer Therapy.靶向代谢治疗癌症。
Cell Chem Biol. 2017 Sep 21;24(9):1161-1180. doi: 10.1016/j.chembiol.2017.08.028.