• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于输入输出数据的连续时间最优控制的多 Actor-Critic 结构。

Multiple actor-critic structures for continuous-time optimal control using input-output data.

出版信息

IEEE Trans Neural Netw Learn Syst. 2015 Apr;26(4):851-65. doi: 10.1109/TNNLS.2015.2399020. Epub 2015 Feb 26.

DOI:10.1109/TNNLS.2015.2399020
PMID:25730830
Abstract

In industrial process control, there may be multiple performance objectives, depending on salient features of the input-output data. Aiming at this situation, this paper proposes multiple actor-critic structures to obtain the optimal control via input-output data for unknown nonlinear systems. The shunting inhibitory artificial neural network (SIANN) is used to classify the input-output data into one of several categories. Different performance measure functions may be defined for disparate categories. The approximate dynamic programming algorithm, which contains model module, critic network, and action network, is used to establish the optimal control in each category. A recurrent neural network (RNN) model is used to reconstruct the unknown system dynamics using input-output data. NNs are used to approximate the critic and action networks, respectively. It is proven that the model error and the closed unknown system are uniformly ultimately bounded. Simulation results demonstrate the performance of the proposed optimal control scheme for the unknown nonlinear system.

摘要

在工业过程控制中,可能存在多个性能目标,具体取决于输入-输出数据的显著特征。针对这种情况,本文提出了多个演员-评论家结构,通过输入-输出数据为未知非线性系统获得最优控制。分流抑制人工神经网络(SIANN)用于将输入-输出数据分类到几个类别之一。不同的性能度量函数可以为不同的类别定义。近似动态规划算法,包含模型模块、批评者网络和动作网络,用于在每个类别中建立最优控制。递归神经网络(RNN)模型用于使用输入-输出数据来重建未知系统动态。神经网络分别用于近似批评家和动作网络。证明了模型误差和封闭的未知系统是一致最终有界的。仿真结果验证了所提出的未知非线性系统最优控制方案的性能。

相似文献

1
Multiple actor-critic structures for continuous-time optimal control using input-output data.基于输入输出数据的连续时间最优控制的多 Actor-Critic 结构。
IEEE Trans Neural Netw Learn Syst. 2015 Apr;26(4):851-65. doi: 10.1109/TNNLS.2015.2399020. Epub 2015 Feb 26.
2
Adaptive optimal control of unknown constrained-input systems using policy iteration and neural networks.基于策略迭代和神经网络的未知约束输入系统自适应最优控制。
IEEE Trans Neural Netw Learn Syst. 2013 Oct;24(10):1513-25. doi: 10.1109/TNNLS.2013.2276571.
3
Observer-based adaptive neural network control for nonlinear stochastic systems with time delay.基于观测器的自适应神经网络控制在时滞非线性随机系统中的应用。
IEEE Trans Neural Netw Learn Syst. 2013 Jan;24(1):71-80. doi: 10.1109/TNNLS.2012.2223824.
4
Control of nonaffine nonlinear discrete-time systems using reinforcement-learning-based linearly parameterized neural networks.基于强化学习的线性参数化神经网络对非仿射非线性离散时间系统的控制
IEEE Trans Syst Man Cybern B Cybern. 2008 Aug;38(4):994-1001. doi: 10.1109/TSMCB.2008.926607.
5
Neural network approach to continuous-time direct adaptive optimal control for partially unknown nonlinear systems.针对部分未知非线性系统的连续时间直接自适应最优控制的神经网络方法。
Neural Netw. 2009 Apr;22(3):237-46. doi: 10.1016/j.neunet.2009.03.008. Epub 2009 Mar 26.
6
Finite-Horizon Near-Optimal Output Feedback Neural Network Control of Quantized Nonlinear Discrete-Time Systems With Input Constraint.带输入约束的量化非线性离散时间系统的有限时域近最优输出反馈神经网络控制。
IEEE Trans Neural Netw Learn Syst. 2015 Aug;26(8):1776-88. doi: 10.1109/TNNLS.2015.2409301. Epub 2015 Mar 18.
7
Decentralized optimal control of a class of interconnected nonlinear discrete-time systems by using online Hamilton-Jacobi-Bellman formulation.基于在线哈密顿-雅可比-贝尔曼公式的一类互联非线性离散时间系统的分布式最优控制
IEEE Trans Neural Netw. 2011 Nov;22(11):1757-69. doi: 10.1109/TNN.2011.2160968. Epub 2011 Sep 29.
8
Neural network-based finite horizon stochastic optimal control design for nonlinear networked control systems.基于神经网络的非线性网络控制系统有限时域随机最优控制设计。
IEEE Trans Neural Netw Learn Syst. 2015 Mar;26(3):472-85. doi: 10.1109/TNNLS.2014.2315622.
9
Reinforcement learning neural-network-based controller for nonlinear discrete-time systems with input constraints.具有输入约束的非线性离散时间系统的基于强化学习神经网络的控制器
IEEE Trans Syst Man Cybern B Cybern. 2007 Apr;37(2):425-36. doi: 10.1109/tsmcb.2006.883869.
10
Reinforcement-learning-based output-feedback control of nonstrict nonlinear discrete-time systems with application to engine emission control.基于强化学习的非严格非线性离散时间系统输出反馈控制及其在发动机排放控制中的应用
IEEE Trans Syst Man Cybern B Cybern. 2009 Oct;39(5):1162-79. doi: 10.1109/TSMCB.2009.2013272. Epub 2009 Mar 24.