基于策略迭代的连续时间系统的随机线性二次最优控制
来源期刊:控制与决策2015年第9期
论文作者:王涛 张化光
文章页码:1674 - 1678
关键词:随机代数Riccati方程;随机微分方程;策略迭代;最优控制;
摘 要:针对模型参数部分未知的随机线性连续时间系统,通过策略迭代算法求解无限时间随机线性二次(LQ)最优控制问题.求解随机LQ最优控制问题等价于求随机代数Riccati方程(SARE)的解.首先利用伊藤公式将随机微分方程转化为确定性方程,通过策略迭代算法给出SARE的解序列;然后证明SARE的解序列收敛到SARE的解,而且在迭代过程中系统是均方可镇定的;最后通过仿真例子表明策略迭代算法的可行性.
王涛1,2,张化光1
1. 东北大学信息科学与工程学院2. 沈阳师范大学计算机与数学基础教学部
摘 要:针对模型参数部分未知的随机线性连续时间系统,通过策略迭代算法求解无限时间随机线性二次(LQ)最优控制问题.求解随机LQ最优控制问题等价于求随机代数Riccati方程(SARE)的解.首先利用伊藤公式将随机微分方程转化为确定性方程,通过策略迭代算法给出SARE的解序列;然后证明SARE的解序列收敛到SARE的解,而且在迭代过程中系统是均方可镇定的;最后通过仿真例子表明策略迭代算法的可行性.
关键词:随机代数Riccati方程;随机微分方程;策略迭代;最优控制;