• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

截断奇异值分解空间中微阵列表达数据的新型聚类算法。

Novel clustering algorithm for microarray expression data in a truncated SVD space.

作者信息

Horn David, Axel Inon

机构信息

School of Physics and Astronomy, Raymond and Beverly Sackler Faculty of Exact Sciences, Tel Aviv University, Tel Aviv 69978, Israel.

出版信息

Bioinformatics. 2003 Jun 12;19(9):1110-5. doi: 10.1093/bioinformatics/btg053.

DOI:10.1093/bioinformatics/btg053
PMID:12801871
Abstract

MOTIVATION

This paper introduces the application of a novel clustering method to microarray expression data. Its first stage involves compression of dimensions that can be achieved by applying SVD to the gene-sample matrix in microarray problems. Thus the data (samples or genes) can be represented by vectors in a truncated space of low dimensionality, 4 and 5 in the examples studied here. We find it preferable to project all vectors onto the unit sphere before applying a clustering algorithm. The clustering algorithm used here is the quantum clustering method that has one free scale parameter. Although the method is not hierarchical, it can be modified to allow hierarchy in terms of this scale parameter.

RESULTS

We apply our method to three data sets. The results are very promising. On cancer cell data we obtain a dendrogram that reflects correct groupings of cells. In an AML/ALL data set we obtain very good clustering of samples into four classes of the data. Finally, in clustering of genes in yeast cell cycle data we obtain four groups in a problem that is estimated to contain five families.

AVAILABILITY

Software is available as Matlab programs at http://neuron.tau.ac.il/~horn/QC.htm.

摘要

动机

本文介绍了一种新型聚类方法在微阵列表达数据中的应用。其第一阶段涉及维度压缩,这可通过对微阵列问题中的基因 - 样本矩阵应用奇异值分解(SVD)来实现。这样,数据(样本或基因)就可以由低维截断空间中的向量表示,在此处研究的示例中为4维和5维。我们发现在应用聚类算法之前,将所有向量投影到单位球面上更为可取。这里使用的聚类算法是具有一个自由尺度参数的量子聚类方法。虽然该方法不是层次聚类方法,但可以针对此尺度参数进行修改以实现层次聚类。

结果

我们将我们的方法应用于三个数据集。结果非常有前景。在癌细胞数据上,我们得到了反映细胞正确分组的树状图。在急性髓细胞白血病/急性淋巴细胞白血病(AML/ALL)数据集中,我们将样本很好地聚类为数据的四类。最后,在酵母细胞周期数据的基因聚类中,我们在一个估计包含五个家族的问题中得到了四组。

可用性

可通过网址http://neuron.tau.ac.il/~horn/QC.htm以Matlab程序的形式获取软件。

相似文献

1
Novel clustering algorithm for microarray expression data in a truncated SVD space.截断奇异值分解空间中微阵列表达数据的新型聚类算法。
Bioinformatics. 2003 Jun 12;19(9):1110-5. doi: 10.1093/bioinformatics/btg053.
2
Simultaneous gene clustering and subset selection for sample classification via MDL.通过最小描述长度实现用于样本分类的同步基因聚类和子集选择
Bioinformatics. 2003 Jun 12;19(9):1100-9. doi: 10.1093/bioinformatics/btg039.
3
Kernel hierarchical gene clustering from microarray expression data.基于微阵列表达数据的核层次基因聚类
Bioinformatics. 2003 Nov 1;19(16):2097-104. doi: 10.1093/bioinformatics/btg288.
4
Reliable classification of two-class cancer data using evolutionary algorithms.使用进化算法对两类癌症数据进行可靠分类。
Biosystems. 2003 Nov;72(1-2):111-29. doi: 10.1016/s0303-2647(03)00138-2.
5
An unsupervised hierarchical dynamic self-organizing approach to cancer class discovery and marker gene identification in microarray data.一种用于微阵列数据中癌症类别发现和标记基因识别的无监督分层动态自组织方法。
Bioinformatics. 2003 Nov 1;19(16):2131-40. doi: 10.1093/bioinformatics/btg296.
6
Boosting for tumor classification with gene expression data.利用基因表达数据进行肿瘤分类的提升算法
Bioinformatics. 2003 Jun 12;19(9):1061-9. doi: 10.1093/bioinformatics/btf867.
7
Comparisons and validation of statistical clustering techniques for microarray gene expression data.微阵列基因表达数据统计聚类技术的比较与验证
Bioinformatics. 2003 Mar 1;19(4):459-66. doi: 10.1093/bioinformatics/btg025.
8
SamCluster: an integrated scheme for automatic discovery of sample classes using gene expression profile.SamCluster:一种利用基因表达谱自动发现样本类别的综合方案。
Bioinformatics. 2003 May 1;19(7):811-7. doi: 10.1093/bioinformatics/btg095.
9
Multi-class cancer classification via partial least squares with gene expression profiles.基于基因表达谱的偏最小二乘法进行多类别癌症分类
Bioinformatics. 2002 Sep;18(9):1216-26. doi: 10.1093/bioinformatics/18.9.1216.
10
CLICK and EXPANDER: a system for clustering and visualizing gene expression data.CLICK和EXPANDER:一种用于基因表达数据聚类和可视化的系统。
Bioinformatics. 2003 Sep 22;19(14):1787-99. doi: 10.1093/bioinformatics/btg232.

引用本文的文献

1
An Exploratory Radiomics Approach to Quantifying Pulmonary Function in CT Images.基于 CT 图像的放射组学探索性方法定量评估肺功能
Sci Rep. 2019 Aug 8;9(1):11509. doi: 10.1038/s41598-019-48023-5.
2
Global considerations in hierarchical clustering reveal meaningful patterns in data.层次聚类中的全局考量揭示了数据中有意义的模式。
PLoS One. 2008 May 21;3(5):e2247. doi: 10.1371/journal.pone.0002247.
3
Systematic gene function prediction from gene expression data by using a fuzzy nearest-cluster method.利用模糊最近邻聚类方法从基因表达数据中进行系统的基因功能预测。
BMC Bioinformatics. 2006 Dec 12;7 Suppl 4(Suppl 4):S23. doi: 10.1186/1471-2105-7-S4-S23.
4
Disentangling information flow in the Ras-cAMP signaling network.解析Ras - cAMP信号网络中的信息流
Genome Res. 2006 Apr;16(4):520-6. doi: 10.1101/gr.4473506. Epub 2006 Mar 13.
5
Conserved transcription factor binding sites of cancer markers derived from primary lung adenocarcinoma microarrays.源自原发性肺腺癌微阵列的癌症标志物的保守转录因子结合位点
Nucleic Acids Res. 2005 Jan 14;33(1):409-21. doi: 10.1093/nar/gki188. Print 2005.
6
Linear fuzzy gene network models obtained from microarray data by exhaustive search.通过穷举搜索从微阵列数据中获得的线性模糊基因网络模型。
BMC Bioinformatics. 2004 Aug 10;5:108. doi: 10.1186/1471-2105-5-108.