结合应用于遗传分析研讨会17数据的平均对数p值和梯度提升方法的罕见变异合并分析。

Rare variant collapsing in conjunction with mean log p-value and gradient boosting approaches applied to Genetic Analysis Workshop 17 data.

作者信息

Cherkas Yauheniya, Raghavan Nandini, Francke Stephan, Defalco Frank, Wilcox Marsha A

机构信息

Epidemiology, Johnson & Johnson, 1125 Trenton-Harbourton Road, Titusville, NJ 08560, USA.

出版信息

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S94. doi: 10.1186/1753-6561-5-S9-S94.

DOI:10.1186/1753-6561-5-S9-S94

PMID:22373203

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3287936/

Abstract

In addition to methods that can identify common variants associated with susceptibility to common diseases, there has been increasing interest in approaches that can identify rare genetic variants. We use the simulated data provided to the participants of Genetic Analysis Workshop 17 (GAW17) to identify both rare and common single-nucleotide polymorphisms and pathways associated with disease status. We apply a rare variant collapsing approach and the usual association tests for common variants to identify candidates for further analysis using pathway-based and tree-based ensemble approaches. We use the mean log p-value approach to identify a top set of pathways and compare it to those used in simulation of GAW17 dataset. We conclude that the mean log p-value approach is able to identify those pathways in the top list and also related pathways. We also use the stochastic gradient boosting approach for the selected subset of single-nucleotide polymorphisms. When compared the result of this tree-based method with the list of single-nucleotide polymorphisms used in dataset simulation, in addition to correct SNPs we observe number of false positives.

摘要

除了能够识别与常见疾病易感性相关的常见变异的方法外，人们对能够识别罕见遗传变异的方法的兴趣也在不断增加。我们使用提供给遗传分析研讨会17（GAW17）参与者的模拟数据，来识别与疾病状态相关的罕见和常见单核苷酸多态性及通路。我们应用一种罕见变异合并方法和针对常见变异的常规关联测试，以识别使用基于通路和基于树的集成方法进行进一步分析的候选对象。我们使用平均对数p值方法来识别一组顶级通路，并将其与GAW17数据集模拟中使用的通路进行比较。我们得出结论，平均对数p值方法能够识别顶级列表中的那些通路以及相关通路。我们还对选定的单核苷酸多态性子集使用随机梯度提升方法。当将这种基于树的方法的结果与数据模拟中使用的单核苷酸多态性列表进行比较时，除了正确的单核苷酸多态性外，我们还观察到了一些假阳性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9538/3287936/e4ad987b6666/1753-6561-5-S9-S94-1.jpg

相似文献

Rare variant collapsing in conjunction with mean log p-value and gradient boosting approaches applied to Genetic Analysis Workshop 17 data.结合应用于遗传分析研讨会17数据的平均对数p值和梯度提升方法的罕见变异合并分析。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S94. doi: 10.1186/1753-6561-5-S9-S94.

Collapsing-based and kernel-based single-gene analyses applied to Genetic Analysis Workshop 17 mini-exome data.应用于遗传分析研讨会17小外显子数据的基于塌缩法和基于核函数法的单基因分析。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S117. doi: 10.1186/1753-6561-5-S9-S117. eCollection 2011.

Application of collapsing methods for continuous traits to the Genetic Analysis Workshop 17 exome sequence data.将连续性状的压缩方法应用于遗传分析研讨会17外显子组序列数据。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S121. doi: 10.1186/1753-6561-5-S9-S121.

Identification of genetic association of multiple rare variants using collapsing methods.使用连锁分析方法鉴定多个罕见变异的遗传关联。

Genet Epidemiol. 2011;35 Suppl 1(Suppl 1):S101-6. doi: 10.1002/gepi.20658.

Logistic Principal Component Analysis for Rare Variants in Gene-Environment Interaction Analysis.基因-环境相互作用分析中罕见变异的逻辑主成分分析

IEEE/ACM Trans Comput Biol Bioinform. 2014 Nov-Dec;11(6):1020-8. doi: 10.1109/TCBB.2014.2322371.

Evaluation of association tests for rare variants using simulated data sets in the Genetic Analysis Workshop 17 data.在遗传分析研讨会17数据中使用模拟数据集评估罕见变异的关联测试。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S86. doi: 10.1186/1753-6561-5-S9-S86. eCollection 2011.

Comparison of collapsing methods for the statistical analysis of rare variants.用于罕见变异统计分析的压缩方法比较

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S115. doi: 10.1186/1753-6561-5-S9-S115.

Evaluating methods for combining rare variant data in pathway-based tests of genetic association.评估在基于通路的基因关联测试中合并稀有变异数据的方法。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S48. doi: 10.1186/1753-6561-5-S9-S48.

Whole genome sequence analysis of the simulated systolic blood pressure in Genetic Analysis Workshop 18 family data: long-term average and collapsing methods.遗传分析研讨会18家庭数据中模拟收缩压的全基因组序列分析：长期平均法和压缩法

BMC Proc. 2014 Jun 17;8(Suppl 1 Genetic Analysis Workshop 18Vanessa Olmo):S12. doi: 10.1186/1753-6561-8-S1-S12. eCollection 2014.

Novel tree-based method to generate markers from rare variant data.一种基于树的新方法，用于从稀有变异数据中生成标记。

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S102. doi: 10.1186/1753-6561-5-S9-S102.

引用本文的文献

Missing genetic risk in neural tube defects: can exome sequencing yield an insight?神经管缺陷中缺失的遗传风险：外显子组测序能否带来见解？

Birth Defects Res A Clin Mol Teratol. 2014 Aug;100(8):642-6. doi: 10.1002/bdra.23276. Epub 2014 Jul 21.

Detecting rare variant associations: methods for testing haplotypes and multiallelic genotypes.检测罕见变异关联：检测单倍型和复等位基因型的方法。

Genet Epidemiol. 2011;35 Suppl 1(Suppl 1):S85-91. doi: 10.1002/gepi.20656.

本文引用的文献

Genetic Analysis Workshop 17 mini-exome simulation.遗传分析研讨会17小型外显子模拟

BMC Proc. 2011 Nov 29;5 Suppl 9(Suppl 9):S2. doi: 10.1186/1753-6561-5-S9-S2.

CCRaVAT and QuTie-enabling analysis of rare variants in large-scale case control and quantitative trait association studies.大规模病例对照和数量性状关联研究中罕见变异的 CCRaVAT 和 QuTie 分析。

BMC Bioinformatics. 2010 Oct 21;11:527. doi: 10.1186/1471-2105-11-527.

Approaches for evaluating rare polymorphisms in genetic association studies.基因关联研究中评估罕见多态性的方法。

Hum Hered. 2010;69(4):219-28. doi: 10.1159/000291927. Epub 2010 Mar 24.

An evaluation of statistical approaches to rare variant analysis in genetic association studies.遗传关联研究中罕见变异分析的统计方法评估。

Genet Epidemiol. 2010 Feb;34(2):188-93. doi: 10.1002/gepi.20450.

Genomewide association studies--illuminating biologic pathways.全基因组关联研究——揭示生物学通路

N Engl J Med. 2009 Apr 23;360(17):1699-701. doi: 10.1056/NEJMp0808934. Epub 2009 Apr 15.

A groupwise association test for rare mutations using a weighted sum statistic.使用加权和统计量对罕见突变进行分组关联测试。

PLoS Genet. 2009 Feb;5(2):e1000384. doi: 10.1371/journal.pgen.1000384. Epub 2009 Feb 13.

Methods for detecting associations with rare variants for common diseases: application to analysis of sequence data.检测常见疾病与罕见变异关联的方法：在序列数据分析中的应用。

Am J Hum Genet. 2008 Sep;83(3):311-21. doi: 10.1016/j.ajhg.2008.06.024. Epub 2008 Aug 7.

Common and rare variants in multifactorial susceptibility to common diseases.常见疾病多因素易感性中的常见和罕见变异。

Nat Genet. 2008 Jun;40(6):695-701. doi: 10.1038/ng.f.136.

PLINK: a tool set for whole-genome association and population-based linkage analyses.PLINK：一个用于全基因组关联分析和基于群体的连锁分析的工具集。

Am J Hum Genet. 2007 Sep;81(3):559-75. doi: 10.1086/519795. Epub 2007 Jul 25.

A strategy to discover genes that carry multi-allelic or mono-allelic risk for common diseases: a cohort allelic sums test (CAST).一种发现携带常见疾病多等位基因或单等位基因风险的基因的策略：队列等位基因总和检验（CAST）。

Mutat Res. 2007 Feb 3;615(1-2):28-56. doi: 10.1016/j.mrfmmm.2006.09.003. Epub 2006 Nov 13.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

结合应用于遗传分析研讨会17数据的平均对数p值和梯度提升方法的罕见变异合并分析。

Rare variant collapsing in conjunction with mean log p-value and gradient boosting approaches applied to Genetic Analysis Workshop 17 data.

作者信息

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献