• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

测量双簇中线性模式的质量。

Measuring the quality of linear patterns in biclusters.

作者信息

Chen Shuhua, Liu Juan, Zeng Tao

机构信息

School of Computer, Wuhan University, Wuhan, Hubei 430072, China.

School of Computer, Wuhan University, Wuhan, Hubei 430072, China.

出版信息

Methods. 2015 Jul 15;83:18-27. doi: 10.1016/j.ymeth.2015.04.005. Epub 2015 Apr 15.

DOI:10.1016/j.ymeth.2015.04.005
PMID:25890245
Abstract

In microarray analysis, biclustering is used to find the maximal subsets of rows and columns satisfying some coherence criteria. The found submatrices are usually called as biclusters. On one hand, different criteria would help to find different types of biclusters, thus the definition of coherence criterion is critical to the biclustering method. On the other hand, qualitative criteria result to qualitative biclustering methods that cannot evaluate the qualities of the biclusters, while quantitative criteria can numerically show how well the mined biclusters and are more useful in real applications. In bioinformatics communities, there are several quantitative coherence measurements for linear patterns proposed. However, they face the problem of weakness in finding all subtypes of linear patterns or sensitivity to the noise. In this work, we introduce a coherence measurement for the general linear patterns, the minimal mean squared error (MMSE), which is designed to handle the evaluation of biclusters with shifting, scaling and the general linear (the mixed form of shifting and scaling) correlations. The experiments on synthetic and real data sets show that the proposed methods is appropriate for identifying significant general linear biclusters.

摘要

在微阵列分析中,双聚类用于寻找满足某些一致性标准的行和列的最大子集。找到的子矩阵通常称为双聚类。一方面,不同的标准有助于找到不同类型的双聚类,因此一致性标准的定义对双聚类方法至关重要。另一方面,定性标准导致定性双聚类方法无法评估双聚类的质量,而定性标准可以数值显示挖掘出的双聚类的质量如何,并且在实际应用中更有用。在生物信息学领域,已经提出了几种用于线性模式的定量一致性度量。然而,它们面临着在寻找线性模式的所有子类型时存在弱点或对噪声敏感的问题。在这项工作中,我们引入了一种用于一般线性模式的一致性度量,即最小均方误差(MMSE),它旨在处理具有移位、缩放和一般线性(移位和缩放的混合形式)相关性的双聚类的评估。在合成数据集和真实数据集上的实验表明,所提出的方法适用于识别显著的一般线性双聚类。

相似文献

1
Measuring the quality of linear patterns in biclusters.测量双簇中线性模式的质量。
Methods. 2015 Jul 15;83:18-27. doi: 10.1016/j.ymeth.2015.04.005. Epub 2015 Apr 15.
2
A novel coherence measure for discovering scaling biclusters from gene expression data.一种用于从基因表达数据中发现缩放双聚类的新型相干度量。
J Bioinform Comput Biol. 2009 Oct;7(5):853-68. doi: 10.1142/s0219720009004370.
3
Identification of bicluster regions in a binary matrix and its applications.二值矩阵中双聚类区域的识别及其应用。
PLoS One. 2013 Aug 5;8(8):e71680. doi: 10.1371/journal.pone.0071680. Print 2013.
4
Finding multiple coherent biclusters in microarray data using variable string length multiobjective genetic algorithm.使用可变字符串长度多目标遗传算法在微阵列数据中寻找多个相干双聚类
IEEE Trans Inf Technol Biomed. 2009 Nov;13(6):969-75. doi: 10.1109/TITB.2009.2017527. Epub 2009 Mar 16.
5
Shifting-and-Scaling Correlation Based Biclustering Algorithm.基于移位-缩放相关性的双聚类算法
IEEE/ACM Trans Comput Biol Bioinform. 2014 Nov-Dec;11(6):1239-52. doi: 10.1109/TCBB.2014.2323054.
6
An effective measure for assessing the quality of biclusters.评估双聚类质量的有效措施。
Comput Biol Med. 2012 Feb;42(2):245-56. doi: 10.1016/j.compbiomed.2011.11.015. Epub 2011 Dec 21.
7
BicSPAM: flexible biclustering using sequential patterns.BicSPAM:使用序列模式的灵活双聚类
BMC Bioinformatics. 2014 May 6;15:130. doi: 10.1186/1471-2105-15-130.
8
Comparative advantages of novel algorithms using MSR threshold and MSR difference threshold for biclustering gene expression data.使用 MSR 阈值和 MSR 差异阈值的新型算法在基因表达数据分块聚类中的比较优势。
Adv Exp Med Biol. 2011;696:123-34. doi: 10.1007/978-1-4419-7046-6_13.
9
KMeans greedy search hybrid algorithm for biclustering gene expression data.用于基因表达数据的分聚类的 KMeans 贪婪搜索混合算法。
Adv Exp Med Biol. 2010;680:181-8. doi: 10.1007/978-1-4419-5913-3_21.
10
Discovery of error-tolerant biclusters from noisy gene expression data.从嘈杂的基因表达数据中发现容错双聚类。
BMC Bioinformatics. 2011 Nov 24;12 Suppl 12(Suppl 12):S1. doi: 10.1186/1471-2105-12-S12-S1.

引用本文的文献

1
Network-based cancer genomic data integration for pattern discovery.基于网络的癌症基因组数据集成用于模式发现。
BMC Genom Data. 2021 Dec 10;22(Suppl 1):54. doi: 10.1186/s12863-021-01004-y.