• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用权重校正微阵列数据聚类分析中细胞周期同步性的损失。

Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights.

作者信息

Duan Fenghai, Zhang Heping

机构信息

Department of Epidemiology and Public Health, Yale University School of Medicine, New Haven, CT 06520-8034, USA.

出版信息

Bioinformatics. 2004 Jul 22;20(11):1766-71. doi: 10.1093/bioinformatics/bth169. Epub 2004 May 27.

DOI:10.1093/bioinformatics/bth169
PMID:15166015
Abstract

MOTIVATION

Due to the existence of the loss of synchrony in cell-cycle data sets, standard clustering methods (e.g. k-means), which group open reading frames (ORFs) based on similar expression levels, are deficient unless the temporal pattern of the expression levels of the ORFs is taken into account.

METHODS

We propose to improve the performance of the k-means method by assigning a decreasing weight on its variable level and evaluating the 'weighted k-means' on a yeast cell-cycle data set. Protein complexes from a public website are used as biological benchmarks. To compare the k-means clusters with the structures of the protein complexes, we measure the agreement between these two ways of clustering via the adjusted Rand index.

RESULTS

Our results show the time-decreasing weight function--exp[-(1/2)(t(2)/C(2))]--which we assign to the variable level of k-means, generally increases the agreement between protein complexes and k-means clusters when C is near the length of two cell cycles.

摘要

动机

由于细胞周期数据集中存在同步性缺失的情况,标准聚类方法(如k均值法)在基于相似表达水平对开放阅读框(ORF)进行分组时存在缺陷,除非考虑ORF表达水平的时间模式。

方法

我们建议通过对k均值法的变量水平赋予递减权重,并在酵母细胞周期数据集上评估“加权k均值法”来提高k均值法的性能。来自公共网站的蛋白质复合物用作生物学基准。为了将k均值聚类与蛋白质复合物的结构进行比较,我们通过调整后的兰德指数来衡量这两种聚类方式之间的一致性。

结果

我们的结果表明,我们赋予k均值变量水平的时间递减权重函数exp[-(1/2)(t(2)/C(2))],当C接近两个细胞周期的长度时,通常会增加蛋白质复合物与k均值聚类之间的一致性。

相似文献

1
Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights.利用权重校正微阵列数据聚类分析中细胞周期同步性的损失。
Bioinformatics. 2004 Jul 22;20(11):1766-71. doi: 10.1093/bioinformatics/bth169. Epub 2004 May 27.
2
Detecting clusters of different geometrical shapes in microarray gene expression data.在微阵列基因表达数据中检测不同几何形状的聚类。
Bioinformatics. 2005 May 1;21(9):1927-34. doi: 10.1093/bioinformatics/bti251. Epub 2005 Jan 12.
3
Clustering of change patterns using Fourier coefficients.使用傅里叶系数对变化模式进行聚类。
Bioinformatics. 2008 Jan 15;24(2):184-91. doi: 10.1093/bioinformatics/btm568. Epub 2007 Nov 19.
4
Detecting biological associations between genes based on the theory of phase synchronization.基于相位同步理论检测基因之间的生物学关联。
Biosystems. 2008 May;92(2):99-113. doi: 10.1016/j.biosystems.2007.12.006. Epub 2008 Jan 11.
5
Microarray data clustering based on temporal variation: FCV with TSD preclustering.基于时间变化的微阵列数据聚类:采用TSD预聚类的FCV法
Appl Bioinformatics. 2003;2(1):35-45.
6
A multi-stage approach to clustering and imputation of gene expression profiles.一种用于基因表达谱聚类和插补的多阶段方法。
Bioinformatics. 2007 Apr 15;23(8):998-1005. doi: 10.1093/bioinformatics/btm053. Epub 2007 Feb 18.
7
Model-based clustering on the unit sphere with an illustration using gene expression profiles.基于模型的单位球面上的聚类,并通过基因表达谱进行说明。
Biostatistics. 2008 Jan;9(1):66-80. doi: 10.1093/biostatistics/kxm012. Epub 2007 Apr 27.
8
A latent variable model for chemogenomic profiling.一种用于化学基因组学分析的潜在变量模型。
Bioinformatics. 2005 Aug 1;21(15):3286-93. doi: 10.1093/bioinformatics/bti515. Epub 2005 May 26.
9
Analysis of a Gibbs sampler method for model-based clustering of gene expression data.一种基于模型的基因表达数据聚类的吉布斯采样器方法分析。
Bioinformatics. 2008 Jan 15;24(2):176-83. doi: 10.1093/bioinformatics/btm562. Epub 2007 Nov 22.
10
Robust multi-scale clustering of large DNA microarray datasets with the consensus algorithm.使用一致性算法对大型DNA微阵列数据集进行稳健的多尺度聚类
Bioinformatics. 2006 Jan 1;22(1):58-67. doi: 10.1093/bioinformatics/bti746. Epub 2005 Oct 27.

引用本文的文献

1
Handling DNA malfunctions by unsupervised machine learning model.通过无监督机器学习模型处理DNA故障
J Pathol Inform. 2023 Oct 17;14:100340. doi: 10.1016/j.jpi.2023.100340. eCollection 2023.