马尔可夫决策过程复杂性的熵测度
来源期刊:控制与决策2004年第9期
论文作者:王红卫 李琛 刘会新
文章页码:983 - 1980
关键词:马尔可夫决策过程;复杂性;熵测度;
摘 要:应用Shannon熵和其他熵指数来度量马尔可夫决策的复杂性.将马尔可夫链的复杂性、不确定性和不可预测性的度量扩展到马尔可夫决策,提出一套基于信息理论的复杂性度量方法,可用于随机和确定性策略下的完全观测和不完全观测马尔可夫决策.对有关数值进行仿真研究,并给出了计算结果.
王红卫,李琛,刘会新
摘 要:应用Shannon熵和其他熵指数来度量马尔可夫决策的复杂性.将马尔可夫链的复杂性、不确定性和不可预测性的度量扩展到马尔可夫决策,提出一套基于信息理论的复杂性度量方法,可用于随机和确定性策略下的完全观测和不完全观测马尔可夫决策.对有关数值进行仿真研究,并给出了计算结果.
关键词:马尔可夫决策过程;复杂性;熵测度;