半Markov控制过程在折扣代价准则下的最优平稳策略
来源期刊:控制与决策2004年第6期
论文作者:殷保群 李衍杰 周亚平 奚宏生
文章页码:691 - 694
关键词:半Markov控制过程;折扣代价准则;折扣Poisson方程;α-势;最优性方程;最优平稳策略;
摘 要:讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵,对一个SMCP定义了折扣Poisson方程,并由这个方程定义了α 势.基于α 势,给出了由最优平稳策略所满足的最优性方程.最后给出一个求解最优平稳策略的迭代算法,并提供一个数值例子以表明该算法的应用.
殷保群,李衍杰,周亚平,奚宏生
摘 要:讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵,对一个SMCP定义了折扣Poisson方程,并由这个方程定义了α 势.基于α 势,给出了由最优平稳策略所满足的最优性方程.最后给出一个求解最优平稳策略的迭代算法,并提供一个数值例子以表明该算法的应用.
关键词:半Markov控制过程;折扣代价准则;折扣Poisson方程;α-势;最优性方程;最优平稳策略;