• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于混合采样的聚类集成算法,具有全局和局部结构。

Hybrid Sampling-Based Clustering Ensemble With Global and Local Constitutions.

出版信息

IEEE Trans Neural Netw Learn Syst. 2016 May;27(5):952-65. doi: 10.1109/TNNLS.2015.2430821.

DOI:10.1109/TNNLS.2015.2430821
PMID:27101079
Abstract

Among a number of ensemble learning techniques, boosting and bagging are the most popular sampling-based ensemble approaches for classification problems. Boosting is considered stronger than bagging on noise-free data set with complex class structures, whereas bagging is more robust than boosting in cases where noise data are present. In this paper, we extend both ensemble approaches to clustering tasks, and propose a novel hybrid sampling-based clustering ensemble by combining the strengths of boosting and bagging. In our approach, the input partitions are iteratively generated via a hybrid process inspired by both boosting and bagging. Then, a novel consensus function is proposed to encode the local and global cluster structure of input partitions into a single representation, and applies a single clustering algorithm to such representation to obtain the consolidated consensus partition. Our approach has been evaluated on 2-D-synthetic data, collection of benchmarks, and real-world facial recognition data sets, which show that the proposed technique outperforms the existing benchmarks for a variety of clustering tasks.

摘要

在许多集成学习技术中,boosting 和 bagging 是用于分类问题的两种最流行的基于抽样的集成方法。在无噪声、类结构复杂的数据集上,boosting 被认为比 bagging 更强大,而在存在噪声数据的情况下,bagging 比 boosting 更稳健。在本文中,我们将这两种集成方法扩展到聚类任务中,并通过结合 boosting 和 bagging 的优势,提出了一种新的基于抽样的混合聚类集成方法。在我们的方法中,输入分区通过一种受 boosting 和 bagging 启发的混合过程迭代生成。然后,我们提出了一种新的共识函数,将输入分区的局部和全局聚类结构编码为单个表示,并将单个聚类算法应用于该表示,以获得一致的共识分区。我们的方法已经在二维合成数据、基准数据集和真实的人脸识别数据集上进行了评估,结果表明,该方法在各种聚类任务中优于现有的基准。

相似文献

1
Hybrid Sampling-Based Clustering Ensemble With Global and Local Constitutions.基于混合采样的聚类集成算法,具有全局和局部结构。
IEEE Trans Neural Netw Learn Syst. 2016 May;27(5):952-65. doi: 10.1109/TNNLS.2015.2430821.
2
Hybrid fuzzy cluster ensemble framework for tumor clustering from biomolecular data.用于从生物分子数据中进行肿瘤聚类的混合模糊聚类集成框架。
IEEE/ACM Trans Comput Biol Bioinform. 2013 May-Jun;10(3):657-70. doi: 10.1109/TCBB.2013.59.
3
Adaptive Bi-Weighting Toward Automatic Initialization and Model Selection for HMM-Based Hybrid Meta-Clustering Ensembles.自适应双权值法在基于 HMM 的混合元聚类集成自动初始化和模型选择中的应用。
IEEE Trans Cybern. 2019 May;49(5):1657-1668. doi: 10.1109/TCYB.2018.2809562. Epub 2018 Mar 27.
4
Knowledge based cluster ensemble for cancer discovery from biomolecular data.基于知识的聚类集成在生物分子数据中的癌症发现。
IEEE Trans Nanobioscience. 2011 Jun;10(2):76-85. doi: 10.1109/TNB.2011.2144997. Epub 2011 Jul 7.
5
A novel ensemble machine learning for robust microarray data classification.一种用于稳健微阵列数据分类的新型集成机器学习方法。
Comput Biol Med. 2006 Jun;36(6):553-73. doi: 10.1016/j.compbiomed.2005.04.001. Epub 2005 Jun 23.
6
Examining unsupervised ensemble learning using spectroscopy data of organic compounds.使用有机化合物的光谱数据检验无监督集成学习。
J Comput Aided Mol Des. 2023 Jan;37(1):17-37. doi: 10.1007/s10822-022-00488-9. Epub 2022 Nov 21.
7
LCE: a link-based cluster ensemble method for improved gene expression data analysis.LCE:一种基于链接的聚类集成方法,用于改进基因表达数据分析。
Bioinformatics. 2010 Jun 15;26(12):1513-9. doi: 10.1093/bioinformatics/btq226. Epub 2010 May 5.
8
Bagging and boosting negatively correlated neural networks.装袋法和提升法与神经网络呈负相关。
IEEE Trans Syst Man Cybern B Cybern. 2008 Jun;38(3):771-84. doi: 10.1109/TSMCB.2008.922055.
9
Cumulative voting consensus method for partitions with variable number of clusters.具有可变聚类数的分区的累积投票共识方法。
IEEE Trans Pattern Anal Mach Intell. 2008 Jan;30(1):160-73. doi: 10.1109/TPAMI.2007.1138.
10
Combining multiple clusterings using evidence accumulation.使用证据积累合并多个聚类。
IEEE Trans Pattern Anal Mach Intell. 2005 Jun;27(6):835-50. doi: 10.1109/TPAMI.2005.113.

引用本文的文献

1
Reservoir hosts prediction for COVID-19 by hybrid transfer learning model.基于混合迁移学习模型的 COVID-19 储户预测。
J Biomed Inform. 2021 May;117:103736. doi: 10.1016/j.jbi.2021.103736. Epub 2021 Mar 9.
2
Multi-Source Transfer Learning via Ensemble Approach for Initial Diagnosis of Alzheimer's Disease.基于集成方法的多源迁移学习用于阿尔茨海默病的初步诊断
IEEE J Transl Eng Health Med. 2020 Apr 23;8:1400310. doi: 10.1109/JTEHM.2020.2984601. eCollection 2020.