简介概要

一类用于井下路径规划问题的Dyna_Q学习算法

来源期刊:工矿自动化2012年第12期

论文作者:朱美强 李明 张倩

文章页码:71 - 76

关键词:Dyna_Q学习;欧氏距离;启发式规划;路径规划;拉普拉斯特征映射;流形距离;

摘    要:在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究。仿真结果验证了该算法的有效性。

详情信息展示

一类用于井下路径规划问题的Dyna_Q学习算法

朱美强,李明,张倩

中国矿业大学信电学院

摘 要:在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究。仿真结果验证了该算法的有效性。

关键词:Dyna_Q学习;欧氏距离;启发式规划;路径规划;拉普拉斯特征映射;流形距离;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号