• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

线性变换与k均值聚类算法:在曲线聚类中的应用

Linear Transformations and the k-Means Clustering Algorithm: Applications to Clustering Curves.

作者信息

Tarpey Thaddeus

机构信息

Thaddeus Tarpey is Professor, Department of Mathematics and Statistics, Wright State University, Dayton, Ohio.

出版信息

Am Stat. 2007 Feb;61(1):34-40. doi: 10.1198/000313007X171016.

DOI:10.1198/000313007X171016
PMID:17369873
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1828125/
Abstract

Functional data can be clustered by plugging estimated regression coefficients from individual curves into the k-means algorithm. Clustering results can differ depending on how the curves are fit to the data. Estimating curves using different sets of basis functions corresponds to different linear transformations of the data. k-means clustering is not invariant to linear transformations of the data. The optimal linear transformation for clustering will stretch the distribution so that the primary direction of variability aligns with actual differences in the clusters. It is shown that clustering the raw data will often give results similar to clustering regression coefficients obtained using an orthogonal design matrix. Clustering functional data using an L(2) metric on function space can be achieved by clustering a suitable linear transformation of the regression coefficients. An example where depressed individuals are treated with an antidepressant is used for illustration.

摘要

通过将从个体曲线估计出的回归系数代入k均值算法,可以对功能数据进行聚类。聚类结果可能会因曲线与数据的拟合方式不同而有所差异。使用不同的基函数集估计曲线对应于数据的不同线性变换。k均值聚类对于数据的线性变换不是不变的。用于聚类的最优线性变换将拉伸分布,使变异性的主要方向与聚类中的实际差异对齐。结果表明,对原始数据进行聚类通常会得到与使用正交设计矩阵获得的回归系数聚类相似的结果。在函数空间上使用L(2)度量对功能数据进行聚类,可以通过对回归系数的适当线性变换进行聚类来实现。以抑郁症患者接受抗抑郁药治疗的例子进行说明。

相似文献

1
Linear Transformations and the k-Means Clustering Algorithm: Applications to Clustering Curves.线性变换与k均值聚类算法:在曲线聚类中的应用
Am Stat. 2007 Feb;61(1):34-40. doi: 10.1198/000313007X171016.
2
Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区,服用抗叶酸抗疟药物的人群中,叶酸补充剂与疟疾易感性和严重程度的关系。
Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.
3
Clustering Using Boosted Constrained k-Means Algorithm.使用增强约束k均值算法进行聚类
Front Robot AI. 2018 Mar 8;5:18. doi: 10.3389/frobt.2018.00018. eCollection 2018.
4
The next-generation K-means algorithm.下一代K均值算法。
Stat Anal Data Min. 2018 Aug;11(4):153-166. doi: 10.1002/sam.11379. Epub 2018 May 11.
5
D3K: The Dissimilarity-Density-Dynamic Radius K-means Clustering Algorithm for scRNA-Seq Data.D3K:用于单细胞RNA测序数据的差异-密度-动态半径K均值聚类算法
Front Genet. 2022 Jul 1;13:912711. doi: 10.3389/fgene.2022.912711. eCollection 2022.
6
Counting clusters using R-NN curves.使用R-NN曲线对聚类进行计数。
J Chem Inf Model. 2007 Jul-Aug;47(4):1308-18. doi: 10.1021/ci600541f. Epub 2007 Jun 30.
7
GrpClassifierEC: a novel classification approach based on the ensemble clustering space.分组分类器EC:一种基于集成聚类空间的新型分类方法。
Algorithms Mol Biol. 2020 Feb 13;15:3. doi: 10.1186/s13015-020-0162-7. eCollection 2020.
8
Clustering performance comparison using -means and expectation maximization algorithms.使用K均值算法和期望最大化算法的聚类性能比较。
Biotechnol Biotechnol Equip. 2014 Nov 14;28(sup1):S44-S48. doi: 10.1080/13102818.2014.949045. Epub 2014 Nov 6.
9
The global Minmax -means algorithm.全局最小最大均值算法。
Springerplus. 2016 Sep 27;5(1):1665. doi: 10.1186/s40064-016-3329-4. eCollection 2016.
10
Modified fuzzy gap statistic for estimating preferable number of clusters in fuzzy k-means clustering.用于估计模糊k均值聚类中最优聚类数的改进模糊间隙统计量
J Biosci Bioeng. 2008 Mar;105(3):273-81. doi: 10.1263/jbb.105.273.

引用本文的文献

1
Wnt3a signaling with serum supply induces replication stress in cultured cells.血清供应下的Wnt3a信号传导在培养细胞中诱导复制应激。
Biochem Biophys Rep. 2023 Jun 10;35:101499. doi: 10.1016/j.bbrep.2023.101499. eCollection 2023 Sep.
2
Cluster Analysis of Categorical Variables of Parkinson's Disease Patients.帕金森病患者分类变量的聚类分析
Brain Sci. 2021 Sep 29;11(10):1290. doi: 10.3390/brainsci11101290.
3
A Systematic Review of Parkinson's Disease Cluster Analysis Research.帕金森病聚类分析研究的系统评价
Aging Dis. 2021 Oct 1;12(7):1567-1586. doi: 10.14336/AD.2021.0519. eCollection 2021 Oct.
4
Partitioning of functional gene expression data using principal points.使用主点对功能基因表达数据进行划分。
BMC Bioinformatics. 2017 Oct 12;18(1):450. doi: 10.1186/s12859-017-1860-0.
5
Stratified Psychiatry via Convexity-Based Clustering with Applications Towards Moderator Analysis.基于凸性聚类的分层精神病学及其在调节分析中的应用
Stat Interface. 2016 Jul 1;9(3):255-266. doi: 10.4310/SII.2016.v9.n3.a1.
6
Reducing uncertainty in the american community survey through data-driven regionalization.通过数据驱动的区域化减少美国社区调查中的不确定性。
PLoS One. 2015 Feb 27;10(2):e0115626. doi: 10.1371/journal.pone.0115626. eCollection 2015.
7
Optimal Partitioning for Linear Mixed Effects Models: Applications to Identifying Placebo Responders.线性混合效应模型的最优划分:在识别安慰剂反应者中的应用
J Am Stat Assoc. 2010 Jan 1;105(491):968-977. doi: 10.1198/jasa.2010.ap08713.
8
Principal Point Classification: Applications to Differentiating Drug and Placebo Responses in Longitudinal Studies.主要点分类:在纵向研究中区分药物和安慰剂反应的应用。
J Stat Plan Inference. 2010 Feb 1;140(2):539-550. doi: 10.1016/j.jspi.2009.07.030.
9
Partitioning of Functional Data for Understanding Heterogeneity in Psychiatric Conditions.用于理解精神疾病异质性的功能数据划分
Stat Interface. 2009 Jan 1;2(4):413-424. doi: 10.4310/sii.2009.v2.n4.a3.
10
Identifying patterns in treatment response profiles in acute bipolar mania: a cluster analysis approach.识别急性双相躁狂症治疗反应概况中的模式:一种聚类分析方法。
BMC Psychiatry. 2008 Jul 29;8:65. doi: 10.1186/1471-244X-8-65.

本文引用的文献

1
Finite mixture modeling with mixture outcomes using the EM algorithm.使用期望最大化(EM)算法对具有混合结果的有限混合模型进行建模。
Biometrics. 1999 Jun;55(2):463-9. doi: 10.1111/j.0006-341x.1999.00463.x.
2
Allometric extension.异速生长扩展
Biometrics. 1999 Dec;55(4):1210-4. doi: 10.1111/j.0006-341x.1999.01210.x.
3
Predictors of relapse during fluoxetine continuation or maintenance treatment of major depression.氟西汀持续或维持治疗重度抑郁症期间复发的预测因素。
J Clin Psychiatry. 2000 Jul;61(7):518-24. doi: 10.4088/jcp.v61n0710.