• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

多臂老虎机中先验设定错误和选择性停止的风险。

The Perils of Misspecified Priors and Optional Stopping in Multi-Armed Bandits.

作者信息

Loecher Markus

机构信息

Berlin School of Economics and Law, Berlin, Germany.

出版信息

Front Artif Intell. 2021 Jul 9;4:715690. doi: 10.3389/frai.2021.715690. eCollection 2021.

DOI:10.3389/frai.2021.715690
PMID:34308342
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8299077/
Abstract

The connection between optimal stopping times of American Options and multi-armed bandits is the subject of active research. This article investigates the effects of optional stopping in a particular class of multi-armed bandit experiments, which randomly allocates observations to arms proportional to the Bayesian posterior probability that each arm is optimal (). The interplay between optional stopping and prior mismatch is examined. We propose a novel partitioning of regret into peri/post testing. We further show a strong dependence of the parameters of interest on the assumed prior probability density.

摘要

美式期权的最优停止时间与多臂老虎机之间的联系是当前积极研究的主题。本文研究了在一类特定的多臂老虎机实验中选择性停止的影响,该实验根据每个臂是最优臂的贝叶斯后验概率,将观测值随机分配到各个臂上。本文还研究了选择性停止与先验不匹配之间的相互作用。我们提出了一种将遗憾分为测试前/测试后的新颖划分方法。我们进一步表明,感兴趣的参数强烈依赖于假定的先验概率密度。

相似文献

1
The Perils of Misspecified Priors and Optional Stopping in Multi-Armed Bandits.多臂老虎机中先验设定错误和选择性停止的风险。
Front Artif Intell. 2021 Jul 9;4:715690. doi: 10.3389/frai.2021.715690. eCollection 2021.
2
Application of multi-armed bandits to dose-finding clinical designs.多臂赌博机在探索性临床试验设计中的应用。
Artif Intell Med. 2023 Dec;146:102713. doi: 10.1016/j.artmed.2023.102713. Epub 2023 Nov 13.
3
An empirical evaluation of active inference in multi-armed bandits.多臂赌博机中主动推理的实证评估。
Neural Netw. 2021 Dec;144:229-246. doi: 10.1016/j.neunet.2021.08.018. Epub 2021 Aug 26.
4
Why optional stopping can be a problem for Bayesians.为什么可选停止对于贝叶斯主义者来说可能是一个问题。
Psychon Bull Rev. 2021 Jun;28(3):795-812. doi: 10.3758/s13423-020-01803-x.
5
Overtaking method based on sand-sifter mechanism: Why do optimistic value functions find optimal solutions in multi-armed bandit problems?基于筛沙机制的超越方法:为何乐观值函数能在多臂老虎机问题中找到最优解?
Biosystems. 2015 Sep;135:55-65. doi: 10.1016/j.biosystems.2015.06.009. Epub 2015 Jul 10.
6
Multi-armed bandits, Thomson sampling and unsupervised machine learning in phylogenetic graph search.多臂老虎机、汤姆逊抽样和无监督机器学习在系统发育图搜索中的应用。
Cladistics. 2024 Aug;40(4):430-437. doi: 10.1111/cla.12572. Epub 2024 Feb 28.
7
Self-Unaware Adversarial Multi-Armed Bandits With Switching Costs.具有切换成本的自我 unaware 对抗性多臂老虎机
IEEE Trans Neural Netw Learn Syst. 2023 Jun;34(6):2908-2922. doi: 10.1109/TNNLS.2021.3110194. Epub 2023 Jun 1.
8
Worked-out examples of the adequacy of Bayesian optional stopping.贝叶斯可选择性中止充分性的实例研究。
Psychon Bull Rev. 2022 Feb;29(1):70-87. doi: 10.3758/s13423-021-01962-5. Epub 2021 Jul 12.
9
An Analysis of the Value of Information When Exploring Stochastic, Discrete Multi-Armed Bandits.探索随机离散多臂老虎机时信息价值的分析
Entropy (Basel). 2018 Feb 28;20(3):155. doi: 10.3390/e20030155.
10
Thompson Sampling for Stochastic Bandits with Noisy Contexts: An Information-Theoretic Regret Analysis.带噪声上下文的随机博弈的汤普森采样:一种信息论后悔分析
Entropy (Basel). 2024 Jul 17;26(7):606. doi: 10.3390/e26070606.

本文引用的文献

1
Why optional stopping can be a problem for Bayesians.为什么可选停止对于贝叶斯主义者来说可能是一个问题。
Psychon Bull Rev. 2021 Jun;28(3):795-812. doi: 10.3758/s13423-020-01803-x.
2
Sequential hypothesis testing with Bayes factors: Efficiently testing mean differences.贝叶斯因子的序贯假设检验:高效检验均值差异。
Psychol Methods. 2017 Jun;22(2):322-339. doi: 10.1037/met0000061. Epub 2015 Dec 14.
3
Beyond Power Calculations: Assessing Type S (Sign) and Type M (Magnitude) Errors.超越功效计算:评估 S 型(信号)和 M 型(幅度)误差。
Perspect Psychol Sci. 2014 Nov;9(6):641-51. doi: 10.1177/1745691614551642.
4
Optional stopping: no problem for Bayesians.选择性停止:对贝叶斯主义者来说不是问题。
Psychon Bull Rev. 2014 Apr;21(2):301-8. doi: 10.3758/s13423-014-0595-4.
5
The frequentist implications of optional stopping on Bayesian hypothesis tests.贝叶斯假设检验中可选择停止的频率主义影响。
Psychon Bull Rev. 2014 Apr;21(2):283-300. doi: 10.3758/s13423-013-0518-9.
6
When decision heuristics and science collide.当决策启发法与科学发生冲突时。
Psychon Bull Rev. 2014 Apr;21(2):268-82. doi: 10.3758/s13423-013-0495-z.
7
A multiple testing procedure for clinical trials.一种用于临床试验的多重检验程序。
Biometrics. 1979 Sep;35(3):549-56.