• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于微阵列数据分析的概率框架:基本概率模型和统计推断。

A probabilistic framework for microarray data analysis: fundamental probability models and statistical inference.

机构信息

Department of Chemical Engineering and Delaware Biotechnology Institute, University of Delaware, Newark, DE 19716, USA.

出版信息

J Theor Biol. 2010 May 21;264(2):211-22. doi: 10.1016/j.jtbi.2010.02.021. Epub 2010 Feb 17.

DOI:10.1016/j.jtbi.2010.02.021
PMID:20170665
Abstract

Gene expression studies generate large quantities of data with the defining characteristic that the number of genes (whose expression profiles are to be determined) exceed the number of available replicates by several orders of magnitude. Standard spot-by-spot analysis still seeks to extract useful information for each gene on the basis of the number of available replicates, and thus plays to the weakness of microarrays. On the other hand, because of the data volume, treating the entire data set as an ensemble, and developing theoretical distributions for these ensembles provides a framework that plays instead to the strength of microarrays. We present theoretical results that under reasonable assumptions, the distribution of microarray intensities follows the Gamma model, with the biological interpretations of the model parameters emerging naturally. We subsequently establish that for each microarray data set, the fractional intensities can be represented as a mixture of Beta densities, and develop a procedure for using these results to draw statistical inference regarding differential gene expression. We illustrate the results with experimental data from gene expression studies on Deinococcus radiodurans following DNA damage using cDNA microarrays.

摘要

基因表达研究产生了大量的数据,其特征在于,要确定其表达谱的基因数量比可用的重复数量超出几个数量级。标准的点到点分析仍然试图根据可用的重复数量为每个基因提取有用的信息,因此利用了微阵列的弱点。另一方面,由于数据量很大,将整个数据集作为一个整体处理,并为这些整体开发理论分布,为微阵列的优势提供了一个框架。我们提出了理论结果,在合理的假设下,微阵列强度的分布遵循伽马模型,模型参数的生物学解释自然出现。随后,我们证明对于每个微阵列数据集,分数强度可以表示为 Beta 密度的混合,并且开发了一种使用这些结果对差异基因表达进行统计推断的方法。我们使用来自 Deinococcus radiodurans 基因表达研究的实验数据进行了说明,该研究使用 cDNA 微阵列研究了 DNA 损伤后的基因表达情况。

相似文献

1
A probabilistic framework for microarray data analysis: fundamental probability models and statistical inference.用于微阵列数据分析的概率框架:基本概率模型和统计推断。
J Theor Biol. 2010 May 21;264(2):211-22. doi: 10.1016/j.jtbi.2010.02.021. Epub 2010 Feb 17.
2
Segmentation and intensity estimation of microarray images using a gamma-t mixture model.使用伽马-t混合模型对微阵列图像进行分割和强度估计。
Bioinformatics. 2007 Feb 15;23(4):458-65. doi: 10.1093/bioinformatics/btl630. Epub 2006 Dec 12.
3
A GMM-IG framework for selecting genes as expression panel biomarkers.一种用于选择基因作为表达谱生物标志物的 GMM-IG 框架。
Artif Intell Med. 2010 Feb-Mar;48(2-3):75-82. doi: 10.1016/j.artmed.2009.07.006. Epub 2009 Dec 8.
4
Mass distributed clustering: a new algorithm for repeated measurements in gene expression data.大规模分布式聚类:一种用于基因表达数据重复测量的新算法。
Genome Inform. 2005;16(2):183-94.
5
A Laplace mixture model for identification of differential expression in microarray experiments.一种用于识别微阵列实验中差异表达的拉普拉斯混合模型。
Biostatistics. 2006 Oct;7(4):630-41. doi: 10.1093/biostatistics/kxj032. Epub 2006 Mar 24.
6
Large scale real-time PCR validation on gene expression measurements from two commercial long-oligonucleotide microarrays.对来自两个商业长寡核苷酸微阵列的基因表达测量值进行大规模实时PCR验证。
BMC Genomics. 2006 Mar 21;7:59. doi: 10.1186/1471-2164-7-59.
7
Modeling microarray data using a threshold mixture model.使用阈值混合模型对微阵列数据进行建模。
Biometrics. 2004 Jun;60(2):376-87. doi: 10.1111/j.0006-341X.2004.00182.x.
8
Variance stabilization and normalization for one-color microarray data using a data-driven multiscale approach.使用数据驱动的多尺度方法对单色微阵列数据进行方差稳定化和归一化处理。
Bioinformatics. 2006 Oct 15;22(20):2547-53. doi: 10.1093/bioinformatics/btl412. Epub 2006 Jul 28.
9
Statistical methods for microarray assays.微阵列分析的统计方法。
J Appl Genet. 2002;43(3):269-78.
10
Autoregressive-model-based missing value estimation for DNA microarray time series data.基于自回归模型的DNA微阵列时间序列数据缺失值估计
IEEE Trans Inf Technol Biomed. 2009 Jan;13(1):131-7. doi: 10.1109/TITB.2008.2007421.

引用本文的文献

1
Super-delta: a new differential gene expression analysis procedure with robust data normalization.超级德尔塔:一种新的具有稳健数据归一化的差异基因表达分析程序。
BMC Bioinformatics. 2017 Dec 21;18(1):582. doi: 10.1186/s12859-017-1992-2.
2
Evaluation of bias-variance trade-off for commonly used post-summarizing normalization procedures in large-scale gene expression studies.大规模基因表达研究中常用的汇总后归一化程序的偏差-方差权衡评估。
PLoS One. 2014 Jun 18;9(6):e99380. doi: 10.1371/journal.pone.0099380. eCollection 2014.
3
Decreased secretion and unfolded protein response upregulation.
分泌减少与未折叠蛋白反应上调。
Methods Enzymol. 2011;491:235-60. doi: 10.1016/B978-0-12-385928-0.00014-6.