Suppr超能文献

离散时间下的一般吉廷斯指数过程。

General Gittins index processes in discrete time.

作者信息

El Karoui N, Karatzas I

机构信息

Laboratoire de Probabilités, Université Pierre et Marie Curie, Paris, France.

出版信息

Proc Natl Acad Sci U S A. 1993 Feb 15;90(4):1232-6. doi: 10.1073/pnas.90.4.1232.

Abstract

We combine the formulation of Mandelbaum [Mandelbaum, A. (1986) Probab. Theory Rel. Fields 71, 129-147] with ideas from Whittle [Whittle, P. (1980) J. R. Stat. Soc. B 42, 143-149] to obtain a simple and constructive proof for the optimality of Gittins index processes in the general, nonmarkovian dynamic allocation (or "multi-armed bandit") problem. Our approach also provides an explicit expression for the value of this problem.

摘要

我们将曼德尔鲍姆的公式[曼德尔鲍姆,A.(1986年)《概率论及其相关领域》71卷,第129 - 147页]与惠特尔的思想[惠特尔,P.(1980年)《皇家统计学会会刊B辑》42卷,第143 - 149页]相结合,以获得一个简单且具有建设性的证明,用于证明吉廷斯指数过程在一般的非马尔可夫动态分配(或“多臂老虎机”)问题中的最优性。我们的方法还为该问题的值提供了一个明确的表达式。

相似文献

1
General Gittins index processes in discrete time.离散时间下的一般吉廷斯指数过程。
Proc Natl Acad Sci U S A. 1993 Feb 15;90(4):1232-6. doi: 10.1073/pnas.90.4.1232.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验