• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

稀疏指数族主成分分析

Sparse Exponential Family Principal Component Analysis.

作者信息

Lu Meng, Huang Jianhua Z, Qian Xiaoning

机构信息

Department of Electrical and Computer Engineering, Texas A&M University, College Station, TX, US, 77840.

Department of Statistics, Texas A&M University, College Station, TX, US, 77840.

出版信息

Pattern Recognit. 2016 Dec;60:681-691. doi: 10.1016/j.patcog.2016.05.024. Epub 2016 May 21.

DOI:10.1016/j.patcog.2016.05.024
PMID:28066030
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5210214/
Abstract

We propose a Sparse exponential family Principal Component Analysis (SePCA) method suitable for any type of data following exponential family distributions, to achieve simultaneous dimension reduction and variable selection for better interpretation of the results. Because of the generality of exponential family distributions, the method can be applied to a wide range of applications, in particular when analyzing high dimensional next-generation sequencing data and genetic mutation data in genomics. The use of sparsity-inducing penalty helps produce sparse principal component loading vectors such that the principal components can focus on informative variables. By using an equivalent dual form of the formulated optimization problem for SePCA, we derive optimal solutions with efficient iterative closed-form updating rules. The results from both simulation experiments and real-world applications have demonstrated the superiority of our SePCA in reconstruction accuracy and computational efficiency over traditional exponential family PCA (ePCA), the existing Sparse PCA (SPCA) and Sparse Logistic PCA (SLPCA) algorithms.

摘要

我们提出了一种适用于任何遵循指数族分布的数据类型的稀疏指数族主成分分析(SePCA)方法,以实现同时降维和变量选择,从而更好地解释结果。由于指数族分布具有一般性,该方法可应用于广泛的应用场景,特别是在分析基因组学中的高维下一代测序数据和基因突变数据时。使用稀疏诱导惩罚有助于产生稀疏的主成分载荷向量,使得主成分能够聚焦于信息变量。通过使用SePCA公式化优化问题的等效对偶形式,我们推导出了具有高效迭代闭式更新规则的最优解。模拟实验和实际应用的结果均表明,我们的SePCA在重构精度和计算效率方面优于传统的指数族主成分分析(ePCA)、现有的稀疏主成分分析(SPCA)和稀疏逻辑主成分分析(SLPCA)算法。

相似文献

1
Sparse Exponential Family Principal Component Analysis.稀疏指数族主成分分析
Pattern Recognit. 2016 Dec;60:681-691. doi: 10.1016/j.patcog.2016.05.024. Epub 2016 May 21.
2
Simple exponential family PCA.简单指数族主成分分析。
IEEE Trans Neural Netw Learn Syst. 2013 Mar;24(3):485-97. doi: 10.1109/TNNLS.2012.2234134.
3
Stochastic convex sparse principal component analysis.随机凸稀疏主成分分析
EURASIP J Bioinform Syst Biol. 2016 Sep 9;2016(1):15. doi: 10.1186/s13637-016-0045-x. eCollection 2016 Dec.
4
Structured Sparse Principal Components Analysis With the TV-Elastic Net Penalty.基于 TV-弹性网络罚项的结构稀疏主成分分析。
IEEE Trans Med Imaging. 2018 Feb;37(2):396-407. doi: 10.1109/TMI.2017.2749140. Epub 2017 Sep 4.
5
Sparse Principal Component Analysis With Preserved Sparsity Pattern.具有保留稀疏模式的稀疏主成分分析
IEEE Trans Image Process. 2019 Jul;28(7):3274-3285. doi: 10.1109/TIP.2019.2895464. Epub 2019 Jan 25.
6
SPARSE LOGISTIC PRINCIPAL COMPONENTS ANALYSIS FOR BINARY DATA.二元数据的稀疏逻辑主成分分析
Ann Appl Stat. 2010 Sep 1;4(3):1579-1601. doi: 10.1214/10-AOAS327SUPP.
7
Incorporating biological information in sparse principal component analysis with application to genomic data.将生物信息纳入稀疏主成分分析并应用于基因组数据。
BMC Bioinformatics. 2017 Jul 11;18(1):332. doi: 10.1186/s12859-017-1740-7.
8
Sparse Principal Component Analysis via Rotation and Truncation.基于旋转和截断的稀疏主成分分析。
IEEE Trans Neural Netw Learn Syst. 2016 Apr;27(4):875-90. doi: 10.1109/TNNLS.2015.2427451. Epub 2015 Dec 22.
9
Performing Sparse Regularization and Dimension Reduction Simultaneously in Multimodal Data Fusion.在多模态数据融合中同时进行稀疏正则化和降维
Front Neurosci. 2019 Jul 3;13:642. doi: 10.3389/fnins.2019.00642. eCollection 2019.
10
Super-sparse principal component analyses for high-throughput genomic data.超高通量基因组数据的超稀疏主成分分析。
BMC Bioinformatics. 2010 Jun 2;11:296. doi: 10.1186/1471-2105-11-296.

引用本文的文献

1
An embedded method for gene identification problems involving unwanted data heterogeneity.一种用于涉及不想要的数据异质性的基因识别问题的嵌入式方法。
Hum Genomics. 2019 Oct 22;13(Suppl 1):45. doi: 10.1186/s40246-019-0228-0.

本文引用的文献

1
SPARSE LOGISTIC PRINCIPAL COMPONENTS ANALYSIS FOR BINARY DATA.二元数据的稀疏逻辑主成分分析
Ann Appl Stat. 2010 Sep 1;4(3):1579-1601. doi: 10.1214/10-AOAS327SUPP.
2
A haplotype map of the human genome.人类基因组单倍型图谱。
Nature. 2005 Oct 27;437(7063):1299-320. doi: 10.1038/nature04226.