• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

高效多任务多核学习及其在癌症研究中的应用。

Efficient Multitask Multiple Kernel Learning With Application to Cancer Research.

出版信息

IEEE Trans Cybern. 2022 Sep;52(9):8716-8728. doi: 10.1109/TCYB.2021.3052357. Epub 2022 Aug 18.

DOI:10.1109/TCYB.2021.3052357
PMID:33705328
Abstract

Multitask multiple kernel learning (MKL) algorithms combine the capabilities of incorporating different data sources into the prediction model and using the data from one task to improve the accuracy on others. However, these methods do not necessarily produce interpretable results. Restricting the solutions to the set of interpretable solutions increases the computational burden of the learning problem significantly, leading to computationally prohibitive run times for some important biomedical applications. That is why we propose a multitask MKL formulation with a clustering of tasks and develop a highly time-efficient solution approach for it. Our solution method is based on the Benders decomposition and treating the clustering problem as finding a given number of tree structures in a graph; hence, it is called the forest formulation. We use our method to discriminate early-stage and late-stage cancers using genomic data and gene sets and compare our algorithm against two other algorithms. The two other algorithms are based on different approaches for linearization of the problem while all algorithms make use of the cutting-plane method. Our results indicate that as the number of tasks and/or the number of desired clusters increase, the forest formulation becomes increasingly favorable in terms of computational performance.

摘要

多任务多核学习(MKL)算法结合了将不同数据源纳入预测模型的能力,并利用一个任务的数据来提高其他任务的准确性。然而,这些方法不一定能产生可解释的结果。将解决方案限制在可解释的解决方案集中会显著增加学习问题的计算负担,从而导致一些重要的生物医学应用的计算时间过长。这就是为什么我们提出了一种具有任务聚类的多任务 MKL 公式,并为其开发了一种高效的解决方案。我们的解决方案方法基于 Benders 分解,并将聚类问题视为在图中找到给定数量的树结构;因此,它被称为森林公式。我们使用基因组数据和基因集来区分早期和晚期癌症,并将我们的算法与另外两种算法进行比较。另外两种算法基于问题线性化的不同方法,而所有算法都使用割平面方法。我们的结果表明,随着任务数量和/或所需聚类数量的增加,森林公式在计算性能方面变得越来越有利。

相似文献

1
Efficient Multitask Multiple Kernel Learning With Application to Cancer Research.高效多任务多核学习及其在癌症研究中的应用。
IEEE Trans Cybern. 2022 Sep;52(9):8716-8728. doi: 10.1109/TCYB.2021.3052357. Epub 2022 Aug 18.
2
A multitask multiple kernel learning formulation for discriminating early- and late-stage cancers.一种用于区分早期和晚期癌症的多任务多核学习公式。
Bioinformatics. 2020 Jun 1;36(12):3766-3772. doi: 10.1093/bioinformatics/btaa168.
3
L2-norm multiple kernel learning and its application to biomedical data fusion.L2-范数多核学习及其在生物医学数据融合中的应用。
BMC Bioinformatics. 2010 Jun 8;11:309. doi: 10.1186/1471-2105-11-309.
4
Inferring latent task structure for Multitask Learning by Multiple Kernel Learning.通过多核学习推断多任务学习中的潜在任务结构。
BMC Bioinformatics. 2010 Oct 26;11 Suppl 8(Suppl 8):S5. doi: 10.1186/1471-2105-11-S8-S5.
5
Discriminating early- and late-stage cancers using multiple kernel learning on gene sets.基于基因集的多核学习区分早期和晚期癌症。
Bioinformatics. 2018 Jul 1;34(13):i412-i421. doi: 10.1093/bioinformatics/bty239.
6
Pareto-path multitask multiple kernel learning.帕累托路径多任务多核学习。
IEEE Trans Neural Netw Learn Syst. 2015 Jan;26(1):51-61. doi: 10.1109/TNNLS.2014.2309939.
7
Convex Discriminative Multitask Clustering.凸判别式多任务聚类。
IEEE Trans Pattern Anal Mach Intell. 2015 Jan;37(1):28-40. doi: 10.1109/TPAMI.2014.2343221.
8
Compositional framework for multitask learning in the identification of cleavage sites of HIV-1 protease.用于识别HIV-1蛋白酶切割位点的多任务学习的组合框架。
J Biomed Inform. 2020 Feb;102:103376. doi: 10.1016/j.jbi.2020.103376. Epub 2020 Jan 11.
9
Fast and interpretable genomic data analysis using multiple approximate kernel learning.使用多种近似核学习进行快速且可解释的基因组数据分析。
Bioinformatics. 2022 Jun 24;38(Suppl 1):i77-i83. doi: 10.1093/bioinformatics/btac241.
10
Multiple-kernel learning for genomic data mining and prediction.基于多核学习的基因组数据挖掘和预测
BMC Bioinformatics. 2019 Aug 15;20(1):426. doi: 10.1186/s12859-019-2992-1.

引用本文的文献

1
Integrated Multi-Omics Analysis Model to Identify Biomarkers Associated With Prognosis of Breast Cancer.用于识别与乳腺癌预后相关生物标志物的综合多组学分析模型
Front Oncol. 2022 Jun 10;12:899900. doi: 10.3389/fonc.2022.899900. eCollection 2022.
2
Diagnostic classification of cancers using DNA methylation of paracancerous tissues.利用癌旁组织的 DNA 甲基化进行癌症的诊断分类。
Sci Rep. 2022 Jun 23;12(1):10646. doi: 10.1038/s41598-022-14786-7.