• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用指数幂混合的稳健聚类

Robust clustering using exponential power mixtures.

作者信息

Zhang Jian, Liang Faming

机构信息

Department of Mathematics, University of York, Heslington, York, UK.

出版信息

Biometrics. 2010 Dec;66(4):1078-86. doi: 10.1111/j.1541-0420.2010.01389.x.

DOI:10.1111/j.1541-0420.2010.01389.x
PMID:20163406
Abstract

Clustering is a widely used method in extracting useful information from gene expression data, where unknown correlation structures in genes are believed to persist even after normalization. Such correlation structures pose a great challenge on the conventional clustering methods, such as the Gaussian mixture (GM) model, k-means (KM), and partitioning around medoids (PAM), which are not robust against general dependence within data. Here we use the exponential power mixture model to increase the robustness of clustering against general dependence and nonnormality of the data. An expectation-conditional maximization algorithm is developed to calculate the maximum likelihood estimators (MLEs) of the unknown parameters in these mixtures. The Bayesian information criterion is then employed to determine the numbers of components of the mixture. The MLEs are shown to be consistent under sparse dependence. Our numerical results indicate that the proposed procedure outperforms GM, KM, and PAM when there are strong correlations or non-Gaussian components in the data.

摘要

聚类是从基因表达数据中提取有用信息的一种广泛使用的方法,即使在归一化之后,基因中未知的相关结构仍被认为是持续存在的。这种相关结构对传统的聚类方法提出了巨大挑战,比如高斯混合(GM)模型、k均值(KM)和围绕中心点划分法(PAM),这些方法对数据中的一般依赖性并不稳健。在这里,我们使用指数幂混合模型来提高聚类对数据的一般依赖性和非正态性的稳健性。开发了一种期望条件最大化算法来计算这些混合模型中未知参数的最大似然估计值(MLE)。然后使用贝叶斯信息准则来确定混合模型的成分数量。在稀疏依赖性下,最大似然估计值被证明是一致的。我们的数值结果表明,当数据中存在强相关性或非高斯成分时,所提出的方法优于GM、KM和PAM。

相似文献

1
Robust clustering using exponential power mixtures.使用指数幂混合的稳健聚类
Biometrics. 2010 Dec;66(4):1078-86. doi: 10.1111/j.1541-0420.2010.01389.x.
2
A mixture model with random-effects components for clustering correlated gene-expression profiles.一种具有随机效应成分的混合模型,用于对相关基因表达谱进行聚类。
Bioinformatics. 2006 Jul 15;22(14):1745-52. doi: 10.1093/bioinformatics/btl165. Epub 2006 May 3.
3
A GMM-IG framework for selecting genes as expression panel biomarkers.一种用于选择基因作为表达谱生物标志物的 GMM-IG 框架。
Artif Intell Med. 2010 Feb-Mar;48(2-3):75-82. doi: 10.1016/j.artmed.2009.07.006. Epub 2009 Dec 8.
4
Robust Bayesian clustering.稳健贝叶斯聚类
Neural Netw. 2007 Jan;20(1):129-38. doi: 10.1016/j.neunet.2006.06.009. Epub 2006 Sep 29.
5
[The use of the expectation-maximization (EM) algorithm for maximum likelihood estimation of gametic frequencies of multilocus polymorphic codominant systems based on sampled population data].[基于抽样群体数据,使用期望最大化(EM)算法对多位点共显性系统的配子频率进行最大似然估计]
Genetika. 2002 Mar;38(3):407-18.
6
Bayesian k-Means as a "maximization-expectation" algorithm.贝叶斯k均值作为一种“最大化-期望”算法。
Neural Comput. 2009 Apr;21(4):1145-72. doi: 10.1162/neco.2008.12-06-421.
7
A Bayesian clustering method for tracking neural signals over successive intervals.一种用于在连续时间间隔中跟踪神经信号的贝叶斯聚类方法。
IEEE Trans Biomed Eng. 2009 Nov;56(11):2649-59. doi: 10.1109/TBME.2009.2027604. Epub 2009 Jul 28.
8
Bayesian clustering of fuzzy feature vectors using a quasi-likelihood approach.使用拟似然方法对模糊特征向量进行贝叶斯聚类。
IEEE Trans Pattern Anal Mach Intell. 2009 Jan;31(1):74-85. doi: 10.1109/TPAMI.2008.53.
9
Model-based clustering of microarray expression data via latent Gaussian mixture models.基于潜在高斯混合模型的微阵列表达数据的模型聚类。
Bioinformatics. 2010 Nov 1;26(21):2705-12. doi: 10.1093/bioinformatics/btq498. Epub 2010 Aug 29.
10
Probing the existence of medium pulmonary crackles via model-based clustering.基于模型聚类技术探究中等肺部湿啰音的存在性
Comput Biol Med. 2010 Sep;40(9):765-74. doi: 10.1016/j.compbiomed.2010.07.004. Epub 2010 Aug 21.

引用本文的文献

1
Parsimony and parameter estimation for mixtures of multivariate leptokurtic-normal distributions.多元尖峰正态分布混合的简约性与参数估计
Adv Data Anal Classif. 2024;18(3):597-625. doi: 10.1007/s11634-023-00558-2. Epub 2023 Sep 27.
2
Molecular-Biology-Driven Frontline Treatment for Chronic Lymphocytic Leukemia: A Network Meta-Analysis of Randomized Clinical Trials.基于分子生物学的慢性淋巴细胞白血病一线治疗:随机临床试验的网络荟萃分析。
Int J Mol Sci. 2023 Jun 9;24(12):9930. doi: 10.3390/ijms24129930.
3
Component selection for exponential power mixture models.
指数幂混合模型的组件选择
J Appl Stat. 2021 Oct 22;50(2):291-314. doi: 10.1080/02664763.2021.1990225. eCollection 2023.
4
Network meta-analysis of randomized trials in multiple myeloma: Efficacy and safety in frontline therapy for patients not eligible for transplant.随机临床试验的网络荟萃分析:不适合移植的多发性骨髓瘤患者一线治疗的疗效和安全性。
Hematol Oncol. 2022 Dec;40(5):987-998. doi: 10.1002/hon.3041. Epub 2022 Jul 11.