• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过部分混合估计进行半参数差异表达分析。

Semi-parametric differential expression analysis via partial mixture estimation.

作者信息

Rossell David, Guerra Rudy, Scott Clayton

机构信息

Institute for Research in Biomedicine of Barcelona.

出版信息

Stat Appl Genet Mol Biol. 2008;7(1):Article15. doi: 10.2202/1544-6115.1333. Epub 2008 Apr 28.

DOI:10.2202/1544-6115.1333
PMID:18454730
Abstract

We develop an approach for microarray differential expression analysis, i.e. identifying genes whose expression levels differ between two or more groups. Current approaches to inference rely either on full parametric assumptions or on permutation-based techniques for sampling under the null distribution. In some situations, however, a full parametric model cannot be justified, or the sample size per group is too small for permutation methods to be valid. We propose a semi-parametric framework based on partial mixture estimation which only requires a parametric assumption for the null (equally expressed) distribution and can handle small sample sizes where permutation methods break down. We develop two novel improvements of Scott's minimum integrated square error criterion for partial mixture estimation [Scott, 2004a,b]. As a side benefit, we obtain interpretable and closed-form estimates for the proportion of EE genes. Pseudo-Bayesian and frequentist procedures for controlling the false discovery rate are given. Results from simulations and real datasets indicate that our approach can provide substantial advantages for small sample sizes over the SAM method of Tusher et al. [2001], the empirical Bayes procedure of Efron and Tibshirani [2002], the mixture of normals of Pan et al. [2003] and a t-test with p-value adjustment [Dudoit et al., 2003] to control the FDR [Benjamini and Hochberg, 1995].

摘要

我们开发了一种用于微阵列差异表达分析的方法,即识别在两个或更多组之间表达水平存在差异的基因。当前的推断方法要么依赖于完全参数假设,要么依赖于基于排列的技术在零分布下进行抽样。然而,在某些情况下,完全参数模型可能不合理,或者每组的样本量太小以至于排列方法无效。我们提出了一种基于部分混合估计的半参数框架,该框架仅对零(等表达)分布需要参数假设,并且可以处理排列方法失效的小样本量情况。我们对用于部分混合估计的斯科特最小积分平方误差准则 [斯科特,2004a,b] 进行了两项新颖的改进。作为一个附带好处,我们获得了可解释的封闭形式的估计值,用于估计等表达基因的比例。给出了用于控制错误发现率的伪贝叶斯和频率主义程序。模拟和真实数据集的结果表明,对于小样本量,我们的方法相对于图舍尔等人 [2001] 的SAM方法、埃弗龙和蒂布希拉尼 [2002] 的经验贝叶斯程序、潘等人 [2003] 的正态混合以及具有p值调整的t检验 [杜多伊特等人,2003] 来控制错误发现率 [本雅明尼和霍赫贝格,1995] 具有显著优势。

相似文献

1
Semi-parametric differential expression analysis via partial mixture estimation.通过部分混合估计进行半参数差异表达分析。
Stat Appl Genet Mol Biol. 2008;7(1):Article15. doi: 10.2202/1544-6115.1333. Epub 2008 Apr 28.
2
Empirical Bayes screening of many p-values with applications to microarray studies.用于微阵列研究的多p值经验贝叶斯筛选。
Bioinformatics. 2005 May 1;21(9):1987-94. doi: 10.1093/bioinformatics/bti301. Epub 2005 Feb 2.
3
Sample size for FDR-control in microarray data analysis.微阵列数据分析中用于错误发现率控制的样本量。
Bioinformatics. 2005 Jul 15;21(14):3097-104. doi: 10.1093/bioinformatics/bti456. Epub 2005 Apr 21.
4
Detecting differentially expressed genes by relative entropy.通过相对熵检测差异表达基因。
J Theor Biol. 2005 Jun 7;234(3):395-402. doi: 10.1016/j.jtbi.2004.11.039. Epub 2005 Jan 24.
5
FDR-controlling testing procedures and sample size determination for microarrays.用于微阵列的错误发现率控制测试程序和样本量确定
Stat Med. 2005 Aug 15;24(15):2267-80. doi: 10.1002/sim.2119.
6
Bias in the estimation of false discovery rate in microarray studies.微阵列研究中错误发现率估计的偏差。
Bioinformatics. 2005 Oct 15;21(20):3865-72. doi: 10.1093/bioinformatics/bti626. Epub 2005 Aug 16.
7
Parametric and nonparametric FDR estimation revisited.参数化和非参数化错误发现率估计的再探讨。
Biometrics. 2006 Sep;62(3):735-44. doi: 10.1111/j.1541-0420.2006.00531.x.
8
Estimating effect sizes of differentially expressed genes for power and sample-size assessments in microarray experiments.在微阵列实验中估计差异表达基因的效应大小以进行功效和样本量评估。
Biometrics. 2011 Dec;67(4):1225-35. doi: 10.1111/j.1541-0420.2011.01618.x. Epub 2011 May 31.
9
On parametric empirical Bayes methods for comparing multiple groups using replicated gene expression profiles.关于使用重复基因表达谱比较多个组的参数经验贝叶斯方法。
Stat Med. 2003 Dec 30;22(24):3899-914. doi: 10.1002/sim.1548.
10
An improved nonparametric approach for detecting differentially expressed genes with replicated microarray data.一种用于利用重复微阵列数据检测差异表达基因的改进非参数方法。
Stat Appl Genet Mol Biol. 2006;5:Article30. doi: 10.2202/1544-6115.1246. Epub 2007 Jan 2.

引用本文的文献

1
Reelin Exerts Structural, Biochemical and Transcriptional Regulation Over Presynaptic and Postsynaptic Elements in the Adult Hippocampus.Reelin对成年海马体中突触前和突触后元件施加结构、生化和转录调控。
Front Cell Neurosci. 2016 May 30;10:138. doi: 10.3389/fncel.2016.00138. eCollection 2016.
2
FoxA and LIPG endothelial lipase control the uptake of extracellular lipids for breast cancer growth.叉头框蛋白A(FoxA)和内皮脂肪酶(LIPG)调控细胞外脂质摄取以促进乳腺癌生长。
Nat Commun. 2016 Apr 5;7:11199. doi: 10.1038/ncomms11199.
3
New insights for Drosophila GAGA factor in larvae.
果蝇幼虫中GAGA因子的新见解。
R Soc Open Sci. 2015 Mar 18;2(3):150011. doi: 10.1098/rsos.150011. eCollection 2015 Mar.
4
Colon cancer cells colonize the lung from established liver metastases through p38 MAPK signalling and PTHLH.结直肠癌细胞通过 p38MAPK 信号通路和 PTHLH 从已建立的肝转移灶定植于肺部。
Nat Cell Biol. 2014 Jul;16(7):685-94. doi: 10.1038/ncb2977. Epub 2014 Jun 1.
5
dKDM5/LID regulates H3K4me3 dynamics at the transcription-start site (TSS) of actively transcribed developmental genes.dKDM5/LID 调控转录起始位点(TSS)处活跃转录的发育基因的 H3K4me3 动力学。
Nucleic Acids Res. 2012 Oct;40(19):9493-505. doi: 10.1093/nar/gks773. Epub 2012 Aug 16.
6
Drosophila melanogaster linker histone dH1 is required for transposon silencing and to preserve genome integrity.果蝇连接组蛋白 dH1 对于转座子沉默和维持基因组完整性是必需的。
Nucleic Acids Res. 2012 Jul;40(12):5402-14. doi: 10.1093/nar/gks224. Epub 2012 Mar 9.