简介概要

基于强化学习的JLQ模型的直接自适应最优控制

来源期刊:控制与决策2008年第12期

论文作者:徐琰恺 陈曦

文章页码:1359 - 2734

关键词:Markov跳变线性系统;策略迭代;Q函数;直接自适应最优控制;

摘    要:研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.

详情信息展示

基于强化学习的JLQ模型的直接自适应最优控制

徐琰恺1,2,陈曦1,2

1. 清华大学自动化系2. 清华大学智能与网络化系统研究中心

摘 要:研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.

关键词:Markov跳变线性系统;策略迭代;Q函数;直接自适应最优控制;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号