用于分位数的交互式Q学习

Interactive Q-learning for Quantiles.

作者信息

Linn Kristin A, Laber Eric B, Stefanski Leonard A

机构信息

Department of Biostatistics and Epidemiology, University of Pennsylvania, Philadelphia, PA 19104.

Department of Statistics, North Carolina State University, Raleigh, NC 27695.

出版信息

J Am Stat Assoc. 2017;112(518):638-649. doi: 10.1080/01621459.2016.1155993. Epub 2017 Mar 31.

DOI:10.1080/01621459.2016.1155993

PMID:28890584

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5586239/

Abstract

A dynamic treatment regime is a sequence of decision rules, each of which recommends treatment based on features of patient medical history such as past treatments and outcomes. Existing methods for estimating optimal dynamic treatment regimes from data optimize the mean of a response variable. However, the mean may not always be the most appropriate summary of performance. We derive estimators of decision rules for optimizing probabilities and quantiles computed with respect to the response distribution for two-stage, binary treatment settings. This enables estimation of dynamic treatment regimes that optimize the cumulative distribution function of the response at a prespecified point or a prespecified quantile of the response distribution such as the median. The proposed methods perform favorably in simulation experiments. We illustrate our approach with data from a sequentially randomized trial where the primary outcome is remission of depression symptoms.

摘要

动态治疗方案是一系列决策规则，每个规则都根据患者病史特征（如既往治疗和治疗结果）推荐治疗方法。现有的从数据中估计最优动态治疗方案的方法会优化响应变量的均值。然而，均值可能并不总是最适合用来总结治疗效果。我们推导了用于优化两阶段二元治疗设置中响应分布的概率和分位数的决策规则估计量。这使得我们能够估计出在预先指定的点上优化响应累积分布函数，或在响应分布的预先指定分位数（如中位数）上优化响应累积分布函数的动态治疗方案。所提出的方法在模拟实验中表现良好。我们用一项序贯随机试验的数据说明了我们的方法，该试验的主要结果是抑郁症状的缓解。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3cf4/5586239/6ef644040eaf/nihms762789f1.jpg

相似文献

Interactive Q-learning for Quantiles.用于分位数的交互式Q学习

J Am Stat Assoc. 2017;112(518):638-649. doi: 10.1080/01621459.2016.1155993. Epub 2017 Mar 31.

Use of personalized Dynamic Treatment Regimes (DTRs) and Sequential Multiple Assignment Randomized Trials (SMARTs) in mental health studies.个性化动态治疗方案（DTRs）和序贯多重分配随机试验（SMARTs）在心理健康研究中的应用。

Shanghai Arch Psychiatry. 2014 Dec;26(6):376-83. doi: 10.11919/j.issn.1002-0829.214172.

Q- and A-learning Methods for Estimating Optimal Dynamic Treatment Regimes.用于估计最优动态治疗方案的问答学习方法。

Stat Sci. 2014 Nov;29(4):640-661. doi: 10.1214/13-STS450.

Estimation of optimal dynamic treatment regimes.最佳动态治疗方案的估计。

Clin Trials. 2014 Aug;11(4):400-407. doi: 10.1177/1740774514532570. Epub 2014 May 28.

Quantile-Optimal Treatment Regimes.分位数最优治疗方案

J Am Stat Assoc. 2018;113(523):1243-1254. doi: 10.1080/01621459.2017.1330204. Epub 2018 Jun 8.

C-learning: A new classification framework to estimate optimal dynamic treatment regimes.C学习法：一种用于估计最优动态治疗方案的新分类框架。

Biometrics. 2018 Sep;74(3):891-899. doi: 10.1111/biom.12836. Epub 2017 Dec 11.

Interpretable Dynamic Treatment Regimes.可解释的动态治疗方案

J Am Stat Assoc. 2018;113(524):1541-1549. doi: 10.1080/01621459.2017.1345743. Epub 2018 Nov 14.

Sample size considerations for comparing dynamic treatment regimens in a sequential multiple-assignment randomized trial with a continuous longitudinal outcome.在具有连续纵向结果的序贯多分配随机试验中比较动态治疗方案时的样本量考量

Stat Methods Med Res. 2020 Jul;29(7):1891-1912. doi: 10.1177/0962280219877520. Epub 2019 Oct 1.

A Bayesian Machine Learning Approach for Optimizing Dynamic Treatment Regimes.一种用于优化动态治疗方案的贝叶斯机器学习方法。

J Am Stat Assoc. 2018;113(523):1255-1267. doi: 10.1080/01621459.2017.1340887. Epub 2018 Oct 8.

Estimation of optimal treatment regimes with electronic medical record data using the residual life value estimator.利用剩余寿命值估计器从电子病历数据中估计最佳治疗方案。

Biostatistics. 2024 Oct 1;25(4):933-946. doi: 10.1093/biostatistics/kxae002.

引用本文的文献

Estimating individualized treatment rules by optimizing the adjusted probability of a longer survival.通过优化更长生存时间的调整概率来估计个体化治疗规则。

Stat Methods Med Res. 2024 Sep;33(9):1517-1530. doi: 10.1177/09622802241262525. Epub 2024 Jul 25.

Variable selection for individualised treatment rules with discrete outcomes.针对具有离散结果的个体化治疗规则进行变量选择。

J R Stat Soc Ser C Appl Stat. 2023 Nov 2;73(2):298-313. doi: 10.1093/jrsssc/qlad096. eCollection 2024 Mar.

Multi-stage optimal dynamic treatment regimes for survival outcomes with dependent censoring.用于具有相依删失的生存结局的多阶段最优动态治疗方案

Biometrika. 2022 Aug 13;110(2):395-410. doi: 10.1093/biomet/asac047. eCollection 2023 Jun.

Performance Guarantees for Policy Learning.策略学习的性能保证

Ann I H P Probab Stat. 2020 Aug;56(3):2162-2188. doi: 10.1214/19-aihp1034. Epub 2020 Jun 26.

A semiparametric instrumental variable approach to optimal treatment regimes under endogeneity.一种用于处理内生性情况下最优治疗方案的半参数工具变量方法。

J Am Stat Assoc. 2021;116(533):162-173. doi: 10.1080/01621459.2020.1783272. Epub 2020 Aug 4.

Estimating Dynamic Treatment Regimes in Mobile Health Using V-learning.使用V学习法估计移动健康中的动态治疗方案。

J Am Stat Assoc. 2020;115(530):692-706. doi: 10.1080/01621459.2018.1537919. Epub 2019 Apr 17.

Efficient augmentation and relaxation learning for individualized treatment rules using observational data.利用观测数据进行个性化治疗规则的高效增强与松弛学习。

J Mach Learn Res. 2019;20.

Precision Medicine.精准医学

Annu Rev Stat Appl. 2019 Mar;6:263-286. doi: 10.1146/annurev-statistics-030718-105251.

Robust regression for optimal individualized treatment rules.稳健回归在最优个体化治疗规则中的应用。

Stat Med. 2019 May 20;38(11):2059-2073. doi: 10.1002/sim.8102. Epub 2019 Feb 11.

A Bayesian nonparametric approach to causal inference on quantiles.一种用于分位数因果推断的贝叶斯非参数方法。

Biometrics. 2018 Sep;74(3):986-996. doi: 10.1111/biom.12863. Epub 2018 Feb 25.

本文引用的文献

Optimal Individualized Treatments in Resource-Limited Settings.资源有限环境下的优化个体化治疗

Int J Biostat. 2016 May 1;12(1):283-303. doi: 10.1515/ijb-2015-0007.

Penalized Q-Learning for Dynamic Treatment Regimens.用于动态治疗方案的惩罚性Q学习

Stat Sin. 2015 Jul;25(3):901-920. doi: 10.5705/ss.2012.364.

New Statistical Learning Methods for Estimating Optimal Dynamic Treatment Regimes.用于估计最优动态治疗方案的新统计学习方法。

J Am Stat Assoc. 2015;110(510):583-598. doi: 10.1080/01621459.2014.937488.

Targeted Maximum Likelihood Estimation for Dynamic and Static Longitudinal Marginal Structural Working Models.动态和静态纵向边际结构工作模型的靶向最大似然估计

J Causal Inference. 2014 Jun 18;2(2):147-185. doi: 10.1515/jci-2013-0007.

Q- and A-learning Methods for Estimating Optimal Dynamic Treatment Regimes.用于估计最优动态治疗方案的问答学习方法。

Stat Sci. 2014 Nov;29(4):640-661. doi: 10.1214/13-STS450.

Interactive model building for -learning.用于学习的交互式模型构建。

Biometrika. 2014 Oct 20;101(4):831-847. doi: 10.1093/biomet/asu043.

Dynamic treatment regimes: technical challenges and applications.动态治疗方案：技术挑战与应用

Electron J Stat. 2014;8(1):1225-1272. doi: 10.1214/14-ejs920.

Estimation of treatment policies based on functional predictors.基于功能预测器的治疗策略估计

Stat Sin. 2014 Jul;24(3):1461-1485. doi: 10.5705/ss.2012.196.

A multiple imputation strategy for sequential multiple assignment randomized trials.序贯多重分配随机试验的多重填补策略

Stat Med. 2014 Oct 30;33(24):4202-14. doi: 10.1002/sim.6223. Epub 2014 Jun 11.

Combining biomarkers to optimize patient treatment recommendations.结合生物标志物以优化患者治疗建议。

Biometrics. 2014 Sep;70(3):695-707. doi: 10.1111/biom.12191. Epub 2014 May 30.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

用于分位数的交互式Q学习

Interactive Q-learning for Quantiles.

作者信息

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献