基于RBF-Q学习的多品种CSPS系统前视距离控制
来源期刊:控制与决策2019年第7期
论文作者:唐昊 杨羊 戴飞 谭琦
文章页码:1456 - 1462
关键词:RBF网络;Q学习;多品种工件;传送带给料加工站;前视距离;
摘 要:研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统Q学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近Q值函数,网络的输入为状态行动对,输出为该状态行动对的Q值.给出RBF-Q学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的Q学习.针对不同的品种数情况进行仿真分析,仿真结果表明, RBF-Q学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度.
唐昊,杨羊,戴飞,谭琦
摘 要:研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统Q学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近Q值函数,网络的输入为状态行动对,输出为该状态行动对的Q值.给出RBF-Q学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的Q学习.针对不同的品种数情况进行仿真分析,仿真结果表明, RBF-Q学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度.
关键词:RBF网络;Q学习;多品种工件;传送带给料加工站;前视距离;