多巴胺峰是奖励预测误差的结果。

Dopamine ramps are a consequence of reward prediction errors.

机构信息

Department of Brain and Cognitive Sciences, MIT, Cambridge, MA 02139, U.S.A.

出版信息

Neural Comput. 2014 Mar;26(3):467-71. doi: 10.1162/NECO_a_00559. Epub 2013 Dec 9.

PMID:24320851

Abstract

Temporal difference learning models of dopamine assert that phasic levels of dopamine encode a reward prediction error. However, this hypothesis has been challenged by recent observations of gradually ramping stratal dopamine levels as a goal is approached. This note describes conditions under which temporal difference learning models predict dopamine ramping. The key idea is representational: a quadratic transformation of proximity to the goal implies approximately linear ramping, as observed experimentally.

摘要

多巴胺的时间差分学习模型断言，多巴胺的相位水平编码了奖励预测误差。然而，最近观察到的逐渐上升的纹状体多巴胺水平作为目标接近时，这一假设受到了挑战。本说明描述了时间差分学习模型预测多巴胺上升的条件。关键思想是表示性的：目标接近度的二次变换意味着实验中观察到的近似线性上升。

相似文献

Dopamine ramps are a consequence of reward prediction errors.

Neural Comput. 2014 Mar;26(3):467-71. doi: 10.1162/NECO_a_00559. Epub 2013 Dec 9.

Involvement of basal ganglia and orbitofrontal cortex in goal-directed behavior.

Prog Brain Res. 2000;126:193-215. doi: 10.1016/S0079-6123(00)26015-9.

Phasic dopamine as a prediction error of intrinsic and extrinsic reinforcements driving both action acquisition and reward maximization: a simulated robotic study.

Neural Netw. 2013 Mar;39:40-51. doi: 10.1016/j.neunet.2012.12.012. Epub 2013 Jan 14.

Striatal dopamine ramping may indicate flexible reinforcement learning with forgetting in the cortico-basal ganglia circuits.

Front Neural Circuits. 2014 Apr 9;8:36. doi: 10.3389/fncir.2014.00036. eCollection 2014.

Time, Not Size, Matters for Striatal Reward Predictions to Dopamine.

Neuron. 2016 Jul 6;91(1):8-11. doi: 10.1016/j.neuron.2016.06.029.

Stimulus representation and the timing of reward-prediction errors in models of the dopamine system.

Neural Comput. 2008 Dec;20(12):3034-54. doi: 10.1162/neco.2008.11-07-654.

Akt1 deficiency modulates reward learning and reward prediction error in mice.

Genes Brain Behav. 2012 Mar;11(2):157-69. doi: 10.1111/j.1601-183X.2011.00759.x.

Midbrain dopamine neurons signal phasic and ramping reward prediction error during goal-directed navigation.

Cell Rep. 2022 Oct 11;41(2):111470. doi: 10.1016/j.celrep.2022.111470.

Modeling functions of striatal dopamine modulation in learning and planning.

Neuroscience. 2001;103(1):65-85. doi: 10.1016/s0306-4522(00)00554-6.

Prolonged dopamine signalling in striatum signals proximity and value of distant rewards.

Nature. 2013 Aug 29;500(7464):575-9. doi: 10.1038/nature12475. Epub 2013 Aug 4.

引用本文的文献

Mesolimbic dopamine ramps reflect environmental timescales.

Elife. 2025 Aug 29;13:RP98666. doi: 10.7554/eLife.98666.

Striatal Gradient in Value-Decay Explains Regional Differences in Dopamine Patterns and Reinforcement Learning Computations.

J Neurosci. 2025 Jul 18. doi: 10.1523/JNEUROSCI.0170-25.2025.

Multi-timescale reinforcement learning in the brain.

Nature. 2025 Jun 4. doi: 10.1038/s41586-025-08929-9.

Dopamine and acetylcholine correlations in the nucleus accumbens depend on behavioral task states.

Curr Biol. 2025 Mar 24;35(6):1400-1407.e3. doi: 10.1016/j.cub.2025.01.064. Epub 2025 Mar 3.

The devilish details affecting TDRL models in dopamine research.

Trends Cogn Sci. 2025 May;29(5):434-447. doi: 10.1016/j.tics.2025.02.001. Epub 2025 Feb 26.

Explaining dopamine through prediction errors and beyond.

Nat Neurosci. 2024 Sep;27(9):1645-1655. doi: 10.1038/s41593-024-01705-4. Epub 2024 Jul 25.

Mesolimbic dopamine ramps reflect environmental timescales.

bioRxiv. 2024 Apr 23:2024.03.27.587103. doi: 10.1101/2024.03.27.587103.

Multi-timescale reinforcement learning in the brain.

bioRxiv. 2023 Nov 14:2023.11.12.566754. doi: 10.1101/2023.11.12.566754.

Striatal Dopamine Signals and Reward Learning.

Function (Oxf). 2023 Oct 3;4(6):zqad056. doi: 10.1093/function/zqad056. eCollection 2023.

Anticipation of Appetitive Operant Action Induces Sustained Dopamine Release in the Nucleus Accumbens.

J Neurosci. 2023 May 24;43(21):3922-3932. doi: 10.1523/JNEUROSCI.1527-22.2023. Epub 2023 Apr 25.

文献AI研究员

20分钟写一篇综述，助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型，支持多种主流文档格式。

立即体验

多巴胺峰是奖励预测误差的结果。

Dopamine ramps are a consequence of reward prediction errors.

机构信息

出版信息

相似文献

引用本文的文献

文献AI研究员

用中文搜PubMed

文档翻译

Suppr 超能文献

相似文献

引用本文的文献