基于稀疏奇异值分解的双聚类

Biclustering via sparse singular value decomposition.

作者信息

Lee Mihee, Shen Haipeng, Huang Jianhua Z, Marron J S

机构信息

Department of Statistics and Operations Research, University of North Carolina at Chapel Hill, Chapel Hill, North Carolina 27599, USA.

出版信息

Biometrics. 2010 Dec;66(4):1087-95. doi: 10.1111/j.1541-0420.2010.01392.x.

DOI:10.1111/j.1541-0420.2010.01392.x

PMID:20163403

Abstract

Sparse singular value decomposition (SSVD) is proposed as a new exploratory analysis tool for biclustering or identifying interpretable row-column associations within high-dimensional data matrices. SSVD seeks a low-rank, checkerboard structured matrix approximation to data matrices. The desired checkerboard structure is achieved by forcing both the left- and right-singular vectors to be sparse, that is, having many zero entries. By interpreting singular vectors as regression coefficient vectors for certain linear regressions, sparsity-inducing regularization penalties are imposed to the least squares regression to produce sparse singular vectors. An efficient iterative algorithm is proposed for computing the sparse singular vectors, along with some discussion of penalty parameter selection. A lung cancer microarray dataset and a food nutrition dataset are used to illustrate SSVD as a biclustering method. SSVD is also compared with some existing biclustering methods using simulated datasets.

摘要

稀疏奇异值分解（SSVD）被提议作为一种新的探索性分析工具，用于双聚类或识别高维数据矩阵中可解释的行-列关联。SSVD寻求对数据矩阵的低秩、棋盘结构矩阵近似。通过强制左奇异向量和右奇异向量都稀疏，即具有许多零元素，来实现所需的棋盘结构。通过将奇异向量解释为某些线性回归的回归系数向量，对最小二乘回归施加诱导稀疏性的正则化惩罚，以产生稀疏奇异向量。提出了一种用于计算稀疏奇异向量的高效迭代算法，并对惩罚参数选择进行了一些讨论。使用肺癌微阵列数据集和食物营养数据集来说明SSVD作为一种双聚类方法。还使用模拟数据集将SSVD与一些现有的双聚类方法进行了比较。

相似文献

Biclustering via sparse singular value decomposition.基于稀疏奇异值分解的双聚类

Biometrics. 2010 Dec;66(4):1087-95. doi: 10.1111/j.1541-0420.2010.01392.x.

Robust biclustering by sparse singular value decomposition incorporating stability selection.基于稀疏奇异值分解和稳定性选择的稳健双聚类。

Bioinformatics. 2011 Aug 1;27(15):2089-97. doi: 10.1093/bioinformatics/btr322. Epub 2011 Jun 2.

Sparse non-negative matrix factorizations via alternating non-negativity-constrained least squares for microarray data analysis.通过交替非负约束最小二乘法进行稀疏非负矩阵分解用于微阵列数据分析

Bioinformatics. 2007 Jun 15;23(12):1495-502. doi: 10.1093/bioinformatics/btm134. Epub 2007 May 5.

Robust integrative biclustering for multi-view data.多视图数据的稳健集成双聚类。

Stat Methods Med Res. 2022 Nov;31(11):2201-2216. doi: 10.1177/09622802221122427. Epub 2022 Sep 13.

Gene selection in cancer classification using sparse logistic regression with Bayesian regularization.使用带贝叶斯正则化的稀疏逻辑回归进行癌症分类中的基因选择。

Bioinformatics. 2006 Oct 1;22(19):2348-55. doi: 10.1093/bioinformatics/btl386. Epub 2006 Jul 14.

svt: Singular Value Thresholding in MATLAB.svt：MATLAB中的奇异值阈值处理

J Stat Softw. 2017;81(2). doi: 10.18637/jss.v081.c02. Epub 2017 Nov 8.

A new geometric biclustering algorithm based on the Hough transform for analysis of large-scale microarray data.一种基于霍夫变换的新型几何双聚类算法，用于大规模微阵列数据分析。

J Theor Biol. 2008 Mar 21;251(2):264-74. doi: 10.1016/j.jtbi.2007.11.030. Epub 2007 Dec 4.

Sparse logistic regression with Lp penalty for biomarker identification.用于生物标志物识别的具有Lp惩罚的稀疏逻辑回归。

Stat Appl Genet Mol Biol. 2007;6:Article6. doi: 10.2202/1544-6115.1248. Epub 2007 Feb 10.

A two-stage linear discriminant analysis via QR-decomposition.一种通过QR分解的两阶段线性判别分析。

IEEE Trans Pattern Anal Mach Intell. 2005 Jun;27(6):929-41. doi: 10.1109/TPAMI.2005.110.

Finding multiple coherent biclusters in microarray data using variable string length multiobjective genetic algorithm.使用可变字符串长度多目标遗传算法在微阵列数据中寻找多个相干双聚类

IEEE Trans Inf Technol Biomed. 2009 Nov;13(6):969-75. doi: 10.1109/TITB.2009.2017527. Epub 2009 Mar 16.

引用本文的文献

Optimal variable clustering for high-dimensional matrix valued data.高维矩阵值数据的最优变量聚类

Inf inference. 2025 Mar 12;14(1):iaaf001. doi: 10.1093/imaiai/iaaf001. eCollection 2025 Mar.

Robust convex biclustering with a tuning-free method.一种无需调优方法的稳健凸双聚类

J Appl Stat. 2024 Jun 17;52(2):271-286. doi: 10.1080/02664763.2024.2367143. eCollection 2025.

Multi-way overlapping clustering by Bayesian tensor decomposition.基于贝叶斯张量分解的多路重叠聚类

Stat Interface. 2024;17(2):219-230. doi: 10.4310/23-sii790. Epub 2024 Feb 1.

Biclustering Multivariate Longitudinal Data with Application to Recovery Trajectories of White Matter After Sport-Related Concussion.双聚类多元纵向数据及其在运动相关脑震荡后白质恢复轨迹中的应用

Data Sci Sci. 2024;3(1). doi: 10.1080/26941899.2024.2376535. Epub 2024 Jul 16.

Generalized Matrix Local Low Rank Representation by Random Projection and Submatrix Propagation.基于随机投影和子矩阵传播的广义矩阵局部低秩表示

KDD. 2023 Aug;2023:390-401. doi: 10.1145/3580305.3599361. Epub 2023 Aug 4.

A Bayesian hierarchical hidden Markov model for clustering and gene selection: Application to kidney cancer gene expression data.一种用于聚类和基因选择的贝叶斯分层隐马尔可夫模型：在肾癌基因表达数据中的应用。

Biom J. 2024 Jun;66(4):e2300173. doi: 10.1002/bimj.202300173.

Robust knowledge-guided biclustering for multi-omics data.基于稳健知识引导的多组学数据双聚类分析。

Brief Bioinform. 2023 Nov 22;25(1). doi: 10.1093/bib/bbad446.

Robust integrative biclustering for multi-view data.多视图数据的稳健集成双聚类。

Stat Methods Med Res. 2022 Nov;31(11):2201-2216. doi: 10.1177/09622802221122427. Epub 2022 Sep 13.

Integrating Multi-Omics Data for Gene-Environment Interactions.整合多组学数据以研究基因-环境相互作用

BioTech (Basel). 2021 Jan 29;10(1):3. doi: 10.3390/biotech10010003.

Multi-scale affinities with missing data: Estimation and applications.具有缺失数据的多尺度亲和力：估计与应用。

Stat Anal Data Min. 2022 Jun;15(3):303-313. doi: 10.1002/sam.11561. Epub 2021 Nov 5.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

基于稀疏奇异值分解的双聚类

Biclustering via sparse singular value decomposition.

作者信息

机构信息

出版信息

相似文献

引用本文的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献