• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基因表达数据中线性模式的双聚类分析

Biclustering of linear patterns in gene expression data.

作者信息

Gao Qinghui, Ho Christine, Jia Yingmin, Li Jingyi Jessica, Huang Haiyan

机构信息

Seventh Research Division and Department of Systems and Control, Beihang University, Beijing China.

出版信息

J Comput Biol. 2012 Jun;19(6):619-31. doi: 10.1089/cmb.2012.0032.

DOI:10.1089/cmb.2012.0032
PMID:22697238
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3375643/
Abstract

Identifying a bicluster, or submatrix of a gene expression dataset wherein the genes express similar behavior over the columns, is useful for discovering novel functional gene interactions. In this article, we introduce a new algorithm for finding biClusters with Linear Patterns (CLiP). Instead of solely maximizing Pearson correlation, we introduce a fitness function that also considers the correlation of complementary genes and conditions. This eliminates the need for a priori determination of the bicluster size. We employ both greedy search and the genetic algorithm in optimization, incorporating resampling for more robust discovery. When applied to both real and simulation datasets, our results show that CLiP is superior to existing methods. In analyzing RNA-seq fly and worm time-course data from modENCODE, we uncover a set of similarly expressed genes suggesting maternal dependence. Supplementary Material is available online (at www.liebertonline.com/cmb).

摘要

识别双聚类(即基因表达数据集中的子矩阵,其中基因在各列上表现出相似行为)对于发现新的功能基因相互作用很有用。在本文中,我们介绍了一种用于寻找具有线性模式的双聚类(CLiP)的新算法。我们引入了一个适应度函数,它不仅能使皮尔逊相关性最大化,还考虑了互补基因和条件的相关性,而不是仅仅最大化皮尔逊相关性。这消除了对双聚类大小进行先验确定的需要。我们在优化过程中同时采用了贪心搜索和遗传算法,并结合重采样以实现更稳健的发现。当应用于真实数据集和模拟数据集时,我们的结果表明CLiP优于现有方法。在分析来自modENCODE的RNA测序果蝇和蠕虫时间进程数据时,我们发现了一组表达相似的基因,表明其对母体的依赖性。补充材料可在网上获取(网址为www.liebertonline.com/cmb)。

相似文献

1
Biclustering of linear patterns in gene expression data.基因表达数据中线性模式的双聚类分析
J Comput Biol. 2012 Jun;19(6):619-31. doi: 10.1089/cmb.2012.0032.
2
KMeans greedy search hybrid algorithm for biclustering gene expression data.用于基因表达数据的分聚类的 KMeans 贪婪搜索混合算法。
Adv Exp Med Biol. 2010;680:181-8. doi: 10.1007/978-1-4419-5913-3_21.
3
Discovering biclusters in gene expression data based on high-dimensional linear geometries.基于高维线性几何在基因表达数据中发现双簇。
BMC Bioinformatics. 2008 Apr 23;9:209. doi: 10.1186/1471-2105-9-209.
4
Parallelized evolutionary learning for detection of biclusters in gene expression data.并行进化学习在基因表达数据中的双聚类检测。
IEEE/ACM Trans Comput Biol Bioinform. 2012;9(2):560-70. doi: 10.1109/TCBB.2011.53. Epub 2011 Mar 3.
5
Identification of coherent patterns in gene expression data using an efficient biclustering algorithm and parallel coordinate visualization.使用高效双聚类算法和并行坐标可视化技术识别基因表达数据中的连贯模式。
BMC Bioinformatics. 2008 Apr 23;9:210. doi: 10.1186/1471-2105-9-210.
6
Application of simulated annealing to the biclustering of gene expression data.模拟退火算法在基因表达数据双聚类中的应用。
IEEE Trans Inf Technol Biomed. 2006 Jul;10(3):519-25. doi: 10.1109/titb.2006.872073.
7
COSCEB: Comprehensive search for column-coherent evolution biclusters and its application to hub gene identification.COSCEB:列一致进化双聚类的全面搜索及其在枢纽基因识别中的应用。
J Biosci. 2019 Jun;44(2).
8
Comparative advantages of novel algorithms using MSR threshold and MSR difference threshold for biclustering gene expression data.使用 MSR 阈值和 MSR 差异阈值的新型算法在基因表达数据分块聚类中的比较优势。
Adv Exp Med Biol. 2011;696:123-34. doi: 10.1007/978-1-4419-7046-6_13.
9
Bi-correlation clustering algorithm for determining a set of co-regulated genes.双相关聚类算法,用于确定一组共同调节的基因。
Bioinformatics. 2009 Nov 1;25(21):2795-801. doi: 10.1093/bioinformatics/btp526. Epub 2009 Sep 3.
10
A probabilistic coevolutionary biclustering algorithm for discovering coherent patterns in gene expression dataset.一种概率协同进化的基因表达数据集共表达模式发现算法。
BMC Bioinformatics. 2012;13 Suppl 17(Suppl 17):S12. doi: 10.1186/1471-2105-13-S17-S12. Epub 2012 Dec 13.

引用本文的文献

1
Pan-Cancer Analysis Reveals the Prognostic Potential of the THAP9/THAP9-AS1 Sense-Antisense Gene Pair in Human Cancers.泛癌分析揭示了THAP9/THAP9-AS1正义-反义基因对在人类癌症中的预后潜力。
Noncoding RNA. 2022 Jul 8;8(4):51. doi: 10.3390/ncrna8040051.
2
Generalized correlation measure using count statistics for gene expression data with ordered samples.基于有序样本的基因表达数据的广义相关度量的计数统计
Bioinformatics. 2018 Feb 15;34(4):617-624. doi: 10.1093/bioinformatics/btx641.
3
Gene co-expression analysis for functional classification and gene-disease predictions.基因共表达分析用于功能分类和基因疾病预测。
Brief Bioinform. 2018 Jul 20;19(4):575-592. doi: 10.1093/bib/bbw139.

本文引用的文献

1
Biclustering of gene expression data by correlation-based scatter search.基于相关性散列搜索的基因表达数据的双聚类。
BioData Min. 2011 Jan 24;4(1):3. doi: 10.1186/1756-0381-4-3.
2
Integrative analysis of the Caenorhabditis elegans genome by the modENCODE project.模式生物基因组计划对秀丽隐杆线虫基因组的综合分析。
Science. 2010 Dec 24;330(6012):1775-87. doi: 10.1126/science.1196914. Epub 2010 Dec 22.
3
Identification of functional elements and regulatory circuits by Drosophila modENCODE.通过 Drosophila modENCODE 鉴定功能元件和调控回路。
Science. 2010 Dec 24;330(6012):1787-97. doi: 10.1126/science.1198374. Epub 2010 Dec 22.
4
Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation.通过 RNA-Seq 进行转录本组装和定量分析揭示了细胞分化过程中未注释的转录本和异构体转换。
Nat Biotechnol. 2010 May;28(5):511-5. doi: 10.1038/nbt.1621. Epub 2010 May 2.
5
FABIA: factor analysis for bicluster acquisition.FABIA:双聚类因子分析。
Bioinformatics. 2010 Jun 15;26(12):1520-7. doi: 10.1093/bioinformatics/btq227. Epub 2010 Apr 23.
6
Bi-correlation clustering algorithm for determining a set of co-regulated genes.双相关聚类算法,用于确定一组共同调节的基因。
Bioinformatics. 2009 Nov 1;25(21):2795-801. doi: 10.1093/bioinformatics/btp526. Epub 2009 Sep 3.
7
QUBIC: a qualitative biclustering algorithm for analyses of gene expression data.QUBIC:一种用于基因表达数据分析的定性双聚类算法。
Nucleic Acids Res. 2009 Aug;37(15):e101. doi: 10.1093/nar/gkp491. Epub 2009 Jun 9.
8
Fast and accurate short read alignment with Burrows-Wheeler transform.使用Burrows-Wheeler变换进行快速准确的短读比对。
Bioinformatics. 2009 Jul 15;25(14):1754-60. doi: 10.1093/bioinformatics/btp324. Epub 2009 May 18.
9
Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.短DNA序列与人类基因组的超快速且内存高效比对。
Genome Biol. 2009;10(3):R25. doi: 10.1186/gb-2009-10-3-r25. Epub 2009 Mar 4.
10
Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources.利用DAVID生物信息学资源对大型基因列表进行系统和综合分析。
Nat Protoc. 2009;4(1):44-57. doi: 10.1038/nprot.2008.211.