• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

K均值聚类中的稳定性分析。

Stability analysis in K-means clustering.

作者信息

Steinley Douglas

机构信息

Department of Psychological Sciences, 210 McAlester Hall, Columbia, MO 65211, USA.

出版信息

Br J Math Stat Psychol. 2008 Nov;61(Pt 2):255-73. doi: 10.1348/000711007X184849. Epub 2007 Feb 22.

DOI:10.1348/000711007X184849
PMID:17535479
Abstract

This paper develops a new procedure, called stability analysis, for K-means clustering. Instead of ignoring local optima and only considering the best solution found, this procedure takes advantage of additional information from a K-means cluster analysis. The information from the locally optimal solutions is collected in an object by object co-occurrence matrix. The co-occurrence matrix is clustered and subsequently reordered by a steepest ascent quadratic assignment procedure to aid visual interpretation of the multidimensional cluster structure. Subsequently, measures are developed to determine the overall structure of a data set, the number of clusters and the multidimensional relationships between the clusters.

摘要

本文针对K均值聚类开发了一种名为稳定性分析的新方法。该方法并非忽略局部最优解而仅考虑找到的最佳解决方案,而是利用K均值聚类分析中的额外信息。来自局部最优解的信息收集在一个逐个对象的共现矩阵中。对该共现矩阵进行聚类,随后通过最速上升二次分配程序重新排序,以辅助对多维聚类结构进行可视化解释。随后,开发了一些度量来确定数据集的整体结构、聚类数量以及聚类之间的多维关系。

相似文献

1
Stability analysis in K-means clustering.K均值聚类中的稳定性分析。
Br J Math Stat Psychol. 2008 Nov;61(Pt 2):255-73. doi: 10.1348/000711007X184849. Epub 2007 Feb 22.
2
Profiling local optima in K-means clustering: developing a diagnostic technique.剖析K均值聚类中的局部最优:开发一种诊断技术。
Psychol Methods. 2006 Jun;11(2):178-92. doi: 10.1037/1082-989X.11.2.178.
3
Clustering binary data in the presence of masking variables.在存在屏蔽变量的情况下对二元数据进行聚类。
Psychol Methods. 2004 Dec;9(4):510-23. doi: 10.1037/1082-989X.9.4.510.
4
Local optima in K-means clustering: what you don't know may hurt you.K均值聚类中的局部最优:你所不知道的可能会伤害到你。
Psychol Methods. 2003 Sep;8(3):294-304. doi: 10.1037/1082-989X.8.3.294.
5
K-means clustering: a half-century synthesis.K均值聚类:半个世纪的综述
Br J Math Stat Psychol. 2006 May;59(Pt 1):1-34. doi: 10.1348/000711005X48266.
6
Bicriterion methods for partitioning dissimilarity matrices.用于划分相异矩阵的双准则方法。
Br J Math Stat Psychol. 2005 Nov;58(Pt 2):319-32. doi: 10.1348/000711005X63890.
7
Modified fuzzy gap statistic for estimating preferable number of clusters in fuzzy k-means clustering.用于估计模糊k均值聚类中最优聚类数的改进模糊间隙统计量
J Biosci Bioeng. 2008 Mar;105(3):273-81. doi: 10.1263/jbb.105.273.
8
Clustering, seriation, and subset extraction of confusion data.混淆数据的聚类、序列化和子集提取。
Psychol Methods. 2006 Sep;11(3):271-86. doi: 10.1037/1082-989X.11.3.271.
9
How many clusters? An information-theoretic perspective.多少个聚类?一种信息论视角。
Neural Comput. 2004 Dec;16(12):2483-506. doi: 10.1162/0899766042321751.
10
K-means clustering versus validation measures: a data-distribution perspective.K均值聚类与验证度量:数据分布视角
IEEE Trans Syst Man Cybern B Cybern. 2009 Apr;39(2):318-31. doi: 10.1109/TSMCB.2008.2004559. Epub 2008 Dec 12.

引用本文的文献

1
Stability estimation for unsupervised clustering: A review.无监督聚类的稳定性估计:综述
Wiley Interdiscip Rev Comput Stat. 2022 Nov-Dec;14(6):e1575. doi: 10.1002/wics.1575. Epub 2022 Jan 9.
2
Clinical characterization of data-driven diabetes subgroups in Mexicans using a reproducible machine learning approach.使用可重复的机器学习方法对墨西哥人群中数据驱动的糖尿病亚组进行临床特征分析。
BMJ Open Diabetes Res Care. 2020 Jul;8(1). doi: 10.1136/bmjdrc-2020-001550.
3
Detecting Clusters/Communities in Social Networks.检测社交网络中的簇/社区。
Multivariate Behav Res. 2018 Jan-Feb;53(1):57-73. doi: 10.1080/00273171.2017.1391682. Epub 2017 Dec 8.
4
A method for making inferences in network analysis: Comment on Forbes, Wright, Markon, and Krueger (2017).一种网络分析中的推理方法:评 Forbes、Wright、Markon 和 Krueger(2017)。
J Abnorm Psychol. 2017 Oct;126(7):1000-1010. doi: 10.1037/abn0000308.
5
Determining optimal diagnostic criteria through chronicity and comorbidity.通过慢性病程和共病情况确定最佳诊断标准。
In Silico Pharmacol. 2016 Dec;4(1):1. doi: 10.1186/s40203-016-0015-8. Epub 2016 Feb 1.
6
Principal Cluster Axes: A Projection Pursuit Index for the Preservation of Cluster Structures in the Presence of Data Reduction.主聚类轴:一种在数据约简情况下用于保留聚类结构的投影寻踪指标。
Multivariate Behav Res. 2012 Jun 18;47(3):463-92. doi: 10.1080/00273171.2012.673952.
7
Classification of bioinformatics workflows using weighted versions of partitioning and hierarchical clustering algorithms.使用分区和层次聚类算法的加权版本对生物信息学工作流程进行分类。
BMC Bioinformatics. 2015 Mar 3;16:68. doi: 10.1186/s12859-015-0508-1.
8
The utility of rural and underserved designations in geospatial assessments of distance traveled to healthcare services: implications for public health research and practice.农村和服务不足地区指定在医疗服务出行距离的地理空间评估中的效用:对公共卫生研究和实践的影响。
J Environ Public Health. 2013;2013:960157. doi: 10.1155/2013/960157. Epub 2013 Jun 13.
9
Finding reproducible cluster partitions for the k-means algorithm.寻找 k-均值算法的可重复聚类分区。
BMC Bioinformatics. 2013;14 Suppl 1(Suppl 1):S8. doi: 10.1186/1471-2105-14-S1-S8. Epub 2013 Jan 14.
10
A convergent functional architecture of the insula emerges across imaging modalities.岛叶在各种成像模式下呈现出趋同的功能结构。
Neuroimage. 2012 Jul 16;61(4):1129-42. doi: 10.1016/j.neuroimage.2012.03.021. Epub 2012 Mar 13.