简介概要

Markov控制过程在紧致行动集上的迭代优化算法

来源期刊:控制与决策2003年第3期

论文作者:唐昊 奚宏生 殷保群

文章页码:267 - 271

关键词:Markov控制过程;紧致行动集;性能势;策略迭代;数值迭代;

摘    要:研究一类连续时间 Markov控制过程 ( CTMCP)在紧致行动集上关于平均代价性能准则的优化算法。根据 CTMCP的性能势公式和平均代价最优性方程 ,导出了求解最优或次最优平稳控制策略的策略迭代算法和数值迭代算法 ,在无需假设迭代算子是 sp-压缩的条件下 ,给出了这两种算法的收敛性证明。最后通过分析一个受控排队网络的例子说明了这种方法的优越性

详情信息展示

Markov控制过程在紧致行动集上的迭代优化算法

唐昊,奚宏生,殷保群

摘 要:研究一类连续时间 Markov控制过程 ( CTMCP)在紧致行动集上关于平均代价性能准则的优化算法。根据 CTMCP的性能势公式和平均代价最优性方程 ,导出了求解最优或次最优平稳控制策略的策略迭代算法和数值迭代算法 ,在无需假设迭代算子是 sp-压缩的条件下 ,给出了这两种算法的收敛性证明。最后通过分析一个受控排队网络的例子说明了这种方法的优越性

关键词:Markov控制过程;紧致行动集;性能势;策略迭代;数值迭代;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号