简介概要

基于RBF-Q学习的多品种CSPS系统前视距离控制

来源期刊:控制与决策2019年第7期

论文作者:唐昊 杨羊 戴飞 谭琦

文章页码:1456 - 1462

关键词:RBF网络;Q学习;多品种工件;传送带给料加工站;前视距离;

摘    要:研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统Q学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近Q值函数,网络的输入为状态行动对,输出为该状态行动对的Q值.给出RBF-Q学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的Q学习.针对不同的品种数情况进行仿真分析,仿真结果表明, RBF-Q学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度.

详情信息展示

基于RBF-Q学习的多品种CSPS系统前视距离控制

唐昊,杨羊,戴飞,谭琦

摘 要:研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统Q学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近Q值函数,网络的输入为状态行动对,输出为该状态行动对的Q值.给出RBF-Q学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的Q学习.针对不同的品种数情况进行仿真分析,仿真结果表明, RBF-Q学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度.

关键词:RBF网络;Q学习;多品种工件;传送带给料加工站;前视距离;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号