Suppr超能文献

无模型双启发式动态规划。

Model-Free Dual Heuristic Dynamic Programming.

出版信息

IEEE Trans Neural Netw Learn Syst. 2015 Aug;26(8):1834-9. doi: 10.1109/TNNLS.2015.2424971. Epub 2015 May 5.

Abstract

Model-based dual heuristic dynamic programming (MB-DHP) is a popular approach in approximating optimal solutions in control problems. Yet, it usually requires offline training for the model network, and thus resulting in extra computational cost. In this brief, we propose a model-free DHP (MF-DHP) design based on finite-difference technique. In particular, we adopt multilayer perceptron with one hidden layer for both the action and the critic networks design, and use delayed objective functions to train both the action and the critic networks online over time. We test both the MF-DHP and MB-DHP approaches with a discrete time example and a continuous time example under the same parameter settings. Our simulation results demonstrate that the MF-DHP approach can obtain a control performance competitive with that of the traditional MB-DHP approach while requiring less computational resources.

摘要

基于模型的双重启发式动态规划 (MB-DHP) 是一种在控制问题中逼近最优解的流行方法。然而,它通常需要对模型网络进行离线训练,因此会产生额外的计算成本。在本简讯中,我们提出了一种基于有限差分技术的无模型 DHP(MF-DHP)设计。具体来说,我们采用具有一个隐藏层的多层感知器来设计动作网络和评价网络,并使用延迟目标函数在线训练动作网络和评价网络。我们在相同的参数设置下,用一个离散时间示例和一个连续时间示例对 MF-DHP 和 MB-DHP 方法进行了测试。我们的仿真结果表明,MF-DHP 方法在需要较少计算资源的情况下,可以获得与传统 MB-DHP 方法相当的控制性能。

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验