• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用隐马尔可夫模型仿样进行基因搜寻。

Gene hunting with hidden Markov model knockoffs.

作者信息

Sesia M, Sabatti C, Candès E J

机构信息

Department of Statistics, Stanford University, 390 Serra Mall, Stanford, California, USA.

出版信息

Biometrika. 2019 Mar;106(1):1-18. doi: 10.1093/biomet/asy033. Epub 2018 Aug 4.

DOI:10.1093/biomet/asy033
PMID:30799875
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6373422/
Abstract

Modern scientific studies often require the identification of a subset of explanatory variables. Several statistical methods have been developed to automate this task, and the framework of knockoffs has been proposed as a general solution for variable selection under rigorous Type I error control, without relying on strong modelling assumptions. In this paper, we extend the methodology of knockoffs to problems where the distribution of the covariates can be described by a hidden Markov model. We develop an exact and efficient algorithm to sample knockoff variables in this setting and then argue that, combined with the existing selective framework, this provides a natural and powerful tool for inference in genome-wide association studies with guaranteed false discovery rate control. We apply our method to datasets on Crohn's disease and some continuous phenotypes.

摘要

现代科学研究常常需要识别解释变量的一个子集。已经开发了几种统计方法来自动完成这项任务,并且“仿冒品”框架已被提出作为在严格的I型错误控制下进行变量选择的通用解决方案,而无需依赖强大的建模假设。在本文中,我们将“仿冒品”方法扩展到协变量分布可以用隐马尔可夫模型描述的问题。我们开发了一种精确且高效的算法来在此设置下对仿冒变量进行采样,然后论证,结合现有的选择框架,这为全基因组关联研究中的推断提供了一个自然且强大的工具,同时保证了错误发现率的控制。我们将我们的方法应用于克罗恩病和一些连续表型的数据集。

相似文献

1
Gene hunting with hidden Markov model knockoffs.使用隐马尔可夫模型仿样进行基因搜寻。
Biometrika. 2019 Mar;106(1):1-18. doi: 10.1093/biomet/asy033. Epub 2018 Aug 4.
2
Knockoff boosted tree for model-free variable selection.无模型变量选择的仿射提升树。
Bioinformatics. 2021 May 17;37(7):976-983. doi: 10.1093/bioinformatics/btaa770.
3
Kernel Knockoffs Selection for Nonparametric Additive Models.非参数加法模型的核仿冒品选择
J Am Stat Assoc. 2023;118(543):2158-2170. doi: 10.1080/01621459.2022.2039671. Epub 2022 Mar 14.
4
Sequential knockoffs for continuous and categorical predictors: With application to a large psoriatic arthritis clinical trial pool.连续型和分类型预测变量的序贯置换检验:在一个大型银屑病关节炎临床试验队列中的应用。
Stat Med. 2021 Jun 30;40(14):3313-3328. doi: 10.1002/sim.8955. Epub 2021 Apr 25.
5
Second-order group knockoffs with applications to GWAS.应用于全基因组关联研究的二阶群组仿冒品
ArXiv. 2024 Mar 4:arXiv:2310.15069v2.
6
Second-order group knockoffs with applications to genome-wide association studies.二阶群组置换检验及其在全基因组关联研究中的应用。
Bioinformatics. 2024 Oct 1;40(10). doi: 10.1093/bioinformatics/btae580.
7
IPAD: Stable Interpretable Forecasting with Knockoffs Inference.IPAD:基于仿冒品推断的稳定可解释预测
J Am Stat Assoc. 2020;115(532):1822-1834. doi: 10.1080/01621459.2019.1654878. Epub 2019 Sep 17.
8
Deep direct likelihood knockoffs.深度直接似然性仿样
Adv Neural Inf Process Syst. 2020 Dec;33:5036-5046.
9
Using knockoffs for controlled predictive biomarker identification.使用仿制药进行控制预测生物标志物的鉴定。
Stat Med. 2021 Nov 10;40(25):5453-5473. doi: 10.1002/sim.9134. Epub 2021 Jul 30.
10
Bayesian variable selection using Knockoffs with applications to genomics.使用仿样变量进行贝叶斯变量选择及其在基因组学中的应用。
Comput Stat. 2022 Sep 18:1-20. doi: 10.1007/s00180-022-01283-8.

引用本文的文献

1
Beware of counter-intuitive levels of false discoveries in datasets with strong intra-correlations.在具有强内部相关性的数据集中,要警惕虚假发现的反直觉水平。
Genome Biol. 2025 Aug 18;26(1):249. doi: 10.1186/s13059-025-03734-z.
2
Transfer Learning in Genome-Wide Association Studies with Knockoffs.使用仿冒品进行全基因组关联研究中的迁移学习
Sankhya B (2008). 2022 Nov 15. doi: 10.1007/s13571-022-00297-y.
3
Uncovering Heterogeneous Effects via Localized Feature Selection.通过局部特征选择揭示异质效应
bioRxiv. 2025 Jun 7:2025.06.03.657761. doi: 10.1101/2025.06.03.657761.
4
Genome-Wide Characterization of the Gene Family in Bunting and the Role of CsANN1 in Dehydrocavidine Biosynthesis.鹀属中该基因家族的全基因组特征及 CsANN1 在脱氢卡维丁生物合成中的作用
Plants (Basel). 2025 Jun 27;14(13):1974. doi: 10.3390/plants14131974.
5
Reflection Knockoffs via Householder Reflection: Applications in Proteomics and Genetic Fine Mapping.通过豪斯霍尔德反射实现的反射仿冒品:在蛋白质组学和基因精细定位中的应用
bioRxiv. 2025 May 29:2025.01.16.633369. doi: 10.1101/2025.01.16.633369.
6
It's a wrap: deriving distinct discoveries with FDR control after a GWAS pipeline.大功告成:在全基因组关联研究流程之后通过错误发现率控制得出不同的发现。
bioRxiv. 2025 Jul 9:2025.06.05.658138. doi: 10.1101/2025.06.05.658138.
7
Characterization of DnaJ gene family in Castanea mollissima and functional analysis of CmDnaJ27 under cold and heat stresses.板栗DnaJ基因家族的鉴定及CmDnaJ27在冷胁迫和热胁迫下的功能分析
BMC Plant Biol. 2025 Jun 9;25(1):778. doi: 10.1186/s12870-025-06829-8.
8
Robust inference with GhostKnockoffs in genome-wide association studies.全基因组关联研究中使用GhostKnockoffs进行稳健推断。
Res Sq. 2025 May 5:rs.3.rs-6396196. doi: 10.21203/rs.3.rs-6396196/v1.
9
Catch me if you can: signal localization with knockoff -values.如果你能做到,就抓住我:利用仿冒值进行信号定位。
J R Stat Soc Series B Stat Methodol. 2024 Jun 14;87(1):56-73. doi: 10.1093/jrsssb/qkae042. eCollection 2025 Feb.
10
Second-order group knockoffs with applications to genome-wide association studies.二阶群组置换检验及其在全基因组关联研究中的应用。
Bioinformatics. 2024 Oct 1;40(10). doi: 10.1093/bioinformatics/btae580.

本文引用的文献

1
Rare and low-frequency coding variants alter human adult height.罕见和低频编码变异会改变人类成年身高。
Nature. 2017 Feb 9;542(7640):186-190. doi: 10.1038/nature21039. Epub 2017 Feb 1.
2
Controlling the Rate of GWAS False Discoveries.控制全基因组关联研究的错误发现率
Genetics. 2017 Jan;205(1):61-75. doi: 10.1534/genetics.116.193987. Epub 2016 Oct 26.
3
UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age.英国生物银行:一个用于识别多种中老年复杂疾病病因的开放获取资源。
PLoS Med. 2015 Mar 31;12(3):e1001779. doi: 10.1371/journal.pmed.1001779. eCollection 2015 Mar.
4
Defining the role of common variation in the genomic and biological architecture of adult human height.确定常见变异在成年人类身高的基因组和生物学结构中的作用。
Nat Genet. 2014 Nov;46(11):1173-86. doi: 10.1038/ng.3097. Epub 2014 Oct 5.
5
Identifying causal variants at loci with multiple signals of association.在具有多个关联信号的基因座上识别因果变异。
Genetics. 2014 Oct;198(2):497-508. doi: 10.1534/genetics.114.167908. Epub 2014 Aug 7.
6
Discovery and refinement of loci associated with lipid levels.发现和完善与脂质水平相关的基因座。
Nat Genet. 2013 Nov;45(11):1274-1283. doi: 10.1038/ng.2797. Epub 2013 Oct 6.
7
ChromHMM: automating chromatin-state discovery and characterization.ChromHMM:染色质状态发现与特征描述自动化
Nat Methods. 2012 Feb 28;9(3):215-6. doi: 10.1038/nmeth.1906.
8
The mystery of missing heritability: Genetic interactions create phantom heritability.遗传力缺失之谜:基因相互作用产生了幽灵遗传力。
Proc Natl Acad Sci U S A. 2012 Jan 24;109(4):1193-8. doi: 10.1073/pnas.1119675109. Epub 2012 Jan 5.
9
Stability selection for genome-wide association.全基因组关联的稳定性选择。
Genet Epidemiol. 2011 Nov;35(7):722-8. doi: 10.1002/gepi.20623. Epub 2011 Aug 26.
10
Haplotype phasing: existing methods and new developments.单体型相位确定:现有方法和新进展。
Nat Rev Genet. 2011 Sep 16;12(10):703-14. doi: 10.1038/nrg3054.