大时滞系统全参数自适应预测控制策略
蒋朝辉,李学明,桂卫华
(中南大学 信息科学与工程学院,湖南 长沙,410083)
摘要:针对大时滞系统纯滞后时间长、参数时变的特点,提出一种基于改进的粒子群优化的自适应预测控制算法。利用改进的粒子群优化算法对时变大时滞系统模型的全部参数进行辨识,从而克服预测模型失配对系统控制性能的影响,并且将粒子群优化算法用于预测控制滚动寻优,有效解决系统存在约束条件下的最优值求解问题。仿真结果验证所提方法的有效性和优越性。
关键词:大时滞系统;全参数辨识;自适应预测控制;粒子群优化
中图分类号:TP273 文献标志码:A 文章编号:1672-7207(2012)01-0195-07
All parameters adaptive predictive control strategy for long time-delay system
JIANG Zhao-hui, LI Xue-ming, GUI Wei-hua
(School of Information Science and Engineering, Central South University, Changsha 410083, China)
Abstract: A new all parameters adaptive predictive control (APAPC) method based on modified particle swarm optimization (PSO) was presented to solve the control problem in time-varing system with long time-delay. All parameters of system model were identified on-line using PSO to effectively overcome the predictive model mismatch. A PSO based predictive control was proposed in which the PSO was used for iterative optimization, which can solve the complicated optimization with various kinds of constraints. The simulation example proves the effectiveness.
Key words: long time-delay system; all parameter identification; adaptive predictive control; particle swarm optimization
在工业生产过程中,被控对象除了具有容积滞后外,往往不同程度地存在着纯滞后。例如,在热交换器中,被加热物料的出口温度作为被控量,载热介质作为控制量。当改变载热介质的流量后,对物料出口温度的影响必然要延时一段时间(即介质经管道所需要的时间)。由于存在纯滞后时间τ,使得被调量不能及时反映系统所承受的扰动,即使测量信号到达调节器,调节机关接受调节信号后立即动作,也需要经过滞后时间τ以后,才波及被调量,使之受到控制,因此,这样的过程必然会产生明显的超调量和较长的调节时间。可见,具有纯滞后的过程被公认为是较难控制的过程。控制的困难在于如何选择一个合适的当前控制,使得系统未来的输出恰好是系统所期望的输出。可见,实现大滞后控制的关键依赖于对系统输出的预测。目前,滞后系统的控制方法主要包括PID控制、滞后补偿控制、预测控制以及智能控制等。PID控制滞后系统的关键是控制器参数的整定,当前已有的参数整定方法如基于幅值裕度和相位裕度的整定方 法[1]、自整定方法[2]、自适应整定方法[3]以及基于优化的整定的方法[4]对滞后时间小的系统能获得较好的效果,但对于大滞后过程无法获得令人满意的输出性 能[5]。滞后补偿控制方法主要包括Smith预估控制[6-7]、内模控制[8]、Dahlin算法[9]等。滞后补偿控制方法从理论上能够解决大滞后系统的控制问题,但是,该方法过于依赖被控过程的精确数学模型,当模型与实际对象有误差时,控制品质将显著恶化,甚至造成系统不稳定,而实际工业对象的精确数学模型很难获得,限制了该方法的实际应用。基于多歩预测、滚动优化与在线校正策略的预测控制具有很强的适应性和鲁棒性,为滞后系统的控制提供了有效途径,国内外学者已提出包括模型控制算法、动态矩阵控制、广义预测控制、预测函数控制等多种预测控制方法[10]。广义预测控制(GPC)[11]是一种重要的自适应算法,该算法以CARIMA模型为基础,采用了长时段的优化性能指标,结合辨识和自校正机制,具有较强的鲁棒性和模型要求低等特点,在工业现场中得到了广泛的应 用[12]。然而,由于实际的生产过程大多是复杂的动态过程,当描述对象的数学模型与实际对象特性之间存在较大误差时,模型误差会对预测控制的精确预报产生较大影响。因此,时变系统在线辨识方法已经成为系统辨识领域中一个十分活跃的研究课题。但目前广泛应用的在线辨识方法大部分都是最小二乘法[13]和极大似然法等离线辨识方法的递推实现。这些方法基本上都属于基于梯度信息的局部搜索方法并且可以采用统一的体系来描述。当目标函数不连续、不可微或高度非线性时,这些方法往往无法搜索到全局最优解。粒子群优化(Particle swarm optimization,PSO)算法是一种新的基于群体智能的启发式全局搜索算法,具有很好和生物社会背景[14]而易理解、参数少而易实现,对非线性、多峰问题均具有较强的全局搜索能力,在科学研究与工程实践中得到了广泛应用[15-17]。大时滞系统因其系统时间常数较大,可以选择较大的采样周期,从而有充分的时间采用启发式全局搜索算法来进行在线计算。因此,本文作者针对大时滞系统预测模型的参数辨识,提出一种基于改进粒子群算法的全参数辨识方法,在线实时辨识出模型的全部参数,并且将改进粒子群算法用于预测控制最优控制量的求解,设计出一种全参数自适应预测控制算法。
1 PSO算法简述
PSO算法是一种基于粒子群的优化计算方法,每个粒子代表优化问题的一个可能解。每次迭代时,每个粒子都依据自身曾经达到的最优位置和所有粒子曾经达到的最优位置来调整自身的飞行速度。这意味着如果1个粒子发现了1个可能最优解,则其他所有粒子会慢慢靠近它,直到所有粒子都找到最优解为止。
在PSO中,每个个体看作是在D维空间中的一个没有质量和体积的微粒。令NPS表示粒子数,第i个粒子的位置描述为,其在搜索空间的个体历史最佳位置为。群体中所有粒子所经历的最好位置为,第i个粒子的飞行速度为。粒子的最大飞行速度为,粒子的搜索空间最大值为,最小值为。假设优化问题为最小化目标函数Jh,进化方程可描述为:
(1)
式中:i=1, 2, …, NPS;c1为调节粒子飞向自身最好位置方向的步长,c2为调节粒子向全局最好位置飞行的步长;r1~U(0, 1),r2~U(0, 1),为2个相互独立的随机函数。Vi中的每个分量被限制在;d (d=1, 2, …, D)用于降低粒子离开搜索空间的可能性,一般vmaxd取为,其中,。则改进的速度公式可写成:
(2)
位置公式为:
(3)
每个粒子的个体历史最佳位置更新方程为:
(4)
群体中所有粒子所经历的最好位置更新方程定义为:
(5)
方程(1)中的第1项为惯性项;ω为惯性权重,表明粒子原先速度能在多大程度上得到保留,用来控制上一时刻速度对当前速度的影响,以影响飞行点的全局与局部搜索能力。ω越大,则全局搜索能力越强。为了平衡PSO算法的全局搜索能力和局部改良能力,本文采用非线性的动态惯性权重系数公式,其表达式如下:
(6)
其中:和分别为的最大值和最小值;J为粒子当前的目标函数值;Javg和Jmin分别为当前所有粒子的平均目标值和最小目标值。
对于学习因子的选择,本文引入异步变化的学习因子,这样使得在优化的初始阶段,粒子具有较强的自我学习能力和较弱的社会学习能力,加强全局搜索能力,而在优化的后期,粒子具有较强的社会学习能力和较弱的自我学习能力,有利于收敛到全局最优解。学习因子的变化公式为:
(7)
其中:c1,ini和c2,ini分别为c1和c2的初始值;c1,fin和c2,fin分别为c1和c2的迭代终值。算法的基本步骤如下。
Step 1:设定各参数,随机初始化种群中各粒子的位置和速度;
Step 2:评价每个粒子的适应度,将当前各微粒的位置和适应值存储在各粒子的Pi中,将所有Pi中适应值最优个体的位置和适应值存储于Pg中;
Step 3:用式(1)~(3)更新粒子的速度和位移;
Step 4:利用式(6)和(7)更新权重的学习因子;
Step 5:对每个粒子,利用式(4)更新其历史最佳位置;
Step 6:利用式(5)更新所有粒子所经历的最好位置;
Step 7:判断迭代次数是否满足停止条件,若满足,搜索停止,输出结果;否则,返回Step 3继续 搜索。
2 基于PSO算法的全参数辨识方法
2.1 对象描述
时滞系统传递函数可描述为:
(m<n)
为了简单,省略了时间参数t。采用零阶保持器,将其离散化,得:
(8)
式中:, 。
写成差分方程形式为:
(9)
则要求辨识连续系统模型参数时,可先辨识离散模型参数,然后转化为等效的连续模型参数,以分析近似连续系统的各种动态和稳态特性。
2.2 辨识算法推导
假设一个时变大时滞系统模型为:
其中:
设是 在k时刻的估计值,则系统实际输出与模型估计输出误差定义为:
当辨识模型与实际系统不同时,。定义性能指标函数如下[18]:
(10)
其中:h为滑动窗口宽度(若参数变化很快,则选择越小的h效果会越好);λ为遗忘因子,0<λ≤1。遗忘因子的引入可以更好地适应跟踪时变动态系统;μ为参数的平方误差系数,用来平衡参数误差和系统输出误差,一般取为0.3~0.5;为时刻的最优参数估计值。
基于PSO算法的全参数在线辨识方法计算步骤如下。
Step 1:设定各参数,随机初始化种群中各粒子的位置和速度。
Step 2:实时采集y(k)和u(k) 。
Step 3:根据式(10)计算每个粒子的适应度,将当前各粒子的位置和适应值存储在各粒子的Pi 中,将所有Pi中适应值最优个体的位置和适应值存储于Pg中。
Step 4:利用式(1)~(3)更新粒子的速度和位移。
Step 5:利用式(6)和(7)更新权重和学习因子。
Step 6:对每个粒子,利用式(4)更新其历史最佳位置。
Step 7:利用式(5)更新所有粒子所经历的最好位置。
Setp 8:判断迭代次数是否满足停止条件,若满足,搜索停止,输出结果;否则,返回Step 4继续搜索。
注1:系统参数辨识和预测控制设计是2个不同的过程,其关系为:先根据辨识算法实时获得预测模型的参数,再根据所获得的预测模型设计控制算法。由于辨识过程是实时的,因此,其所用的模型是线性时变的。而预测控制算法,每一步都会重新计算控制量,每一步计算时的预测模型都已由辨识过程获得,因此,预测控制算法设计时用的是线性时不变模型。
3 基于PSO的预测控制算法设计
3.1 基本原理
将PSO算法引入到广义预测控制的滚动优化中,与基于PSO辨识出的实时动态模型相结合,形成一种全参数自适应预测控制算法。PSO动态辨识器通过实时采集过程输入输出数据,在线辨识被控过程模型的参数,使预测模型的参数跟随被控过程的参数变化而变化,PSO优化器利用PSO动态辨识器得到的预测模型,利用PSO算法,求出使目标函数值最小的控制增量,然后,采用滚动优化策略对系统实施控制。算法原理框图如图1所示。
图1 基于PSO的全参数自适应预测控制原理框图
Fig.1 Block diagram of PSO based APAPC
3.2 预测模型
在GPC中,采用受控自回归积分滑动平均(Controlled auto regressive integrated moving average,CARIMA)模型来计算输出预测值:
(11)
式中:; ; ,;d为纯滞后时间,e(t)为白噪声。
多项式C(z-1)描述了噪声的随机特性,在实际中很难估计,因此,一般将其设为1。
3.3 目标函数
广义预测控制(Generalized predictive control,GPC)的目标函数可写成:
(12)
式中:为t时刻对t+j时刻系统输出值的预测值;N1和N2分别为最大预测时域和最小预测时域,Nu为控制时域;和分别为输出误差加权系数和控制增量加权系数; 为参考轨迹(0<<1)。
预测控制的目标是计算未来控制增量序列,使系统未来输出值在一定的时域内尽可能接近,这是通过采用一个最优预测器计算从而最小化J来实现的。
为了最小化目标函数J,首先将表述成历史数据(控制量和系统输出的历史值)以及未来控制输入量,的函数。然后,将目标函数J可看成是未来控制输入序列的函数,通过最小化J即可获得最优控制输入。
因为系统的时滞特性,取时域N 1和N2分别为d+1和d+N,即考虑的第1个输出预测值为,其与有关的控制量为及其历史控制增量。
3.4 多步预测输出表达式
为了优化目标函数J,必须求得 ()时刻的预测值。考虑如下Diophantine方程:
(13)
式中:; ;。
将式(13)两边同时乘以,得:
(14)
将式(13)代入式(14),得:
即
(15)
由于的阶为,式(15)中噪声项都为未来时刻值,所以,对的最优预测值可表示为:
式中:。
因此,对于,为
写成矩阵形式为:
(16)
式中:
;;
;;
。
注意到式(16)中后2项只与过去时刻的值有关,因此,令,则 。
3.5 利用PSO优化计算控制增量
考虑工业控制中常遇到的3 种约束,即控制信号幅值约束、控制信号增量约束、输出信号幅值约束[19],设粒子维数,采用式(12)作为粒子群优化算法的目标值函数,采用PSO算法对控制增量进行 寻优。
4 仿真研究
设大时滞对象传递函数为,当对象初始参数为K=1,T=35,τ=40,t=300 s时,对象参数变为K=1.15,T=45,τ=53,采用PSO算法对其模型进行实时辨识,并且用PSO算法计算其最优控制量,仿真主要参数设置如下:ωmin=0.6,ωmax=0.9,c1,ini=2.5,c1,fin=0.5,c2,ini=0.5,c2,fin=2.5,Niter=200,Nps=60,N=5,Nu=2,Ts=10,其仿真结果如图2~6所示。
图2 模型参数K和Km辨识结果
Fig.2 Identified results of parameter K and Km
图3 模型参数T和Tm辨识结果
Fig.3 Identified results of parameter T and Tm
图4 模型参数L和Lm辨识结果
Fig.4 Identified results of parameter L and Lm
图5 系统输出曲线
Fig.5 Responses of system w and y(t)
图6 控制量曲线
Fig.6 Control action u(t)
图2~4所示为系统参数K,T和L均变化时PSO算法的辨识结果。由图2可以看出:当对象参数发生变化时,PSO辨识算法能快速响应对象参数变化,具有很强的关于时变大时滞系统的跟踪能力。从图5可以看出:由于预测模型得到了实时修正,系统输出能够在较短时间内克服对象参数时变的影响。由于采用了PSO算法来对控制增量进行求解,对控制量、控制增量设定了相应的约束。从图6可以看出:控制量变化缓和,可以有效减少控制量的频繁变化对执行机构造成的不良影响。
需注意的是:仿真时,为模拟系统对时变系统的响应能力,假设系统300 s以前处于一个稳态,300 s后才发生参数变化,因此,图2~4所示的前300 s的曲线没有起伏。至于系统输出曲线(图5),由于系统时滞为40 s,采样周期为10 s,当系统给定发生变化时,系统由一个稳态过渡到另一个稳态,故响应曲线肯定会滞后1个系统的纯滞后时间加1个采样周期,这是系统的固有特性,因此,系统前50 s的输出变化量为0。
5 结论
(1) 基于一种改进的PSO算法对时变大时滞系统的全部参数进行在线辨识,实时更新对象模型参数,从而克服对象参数时变对系统控制性能的影响。
(2) 考虑工业控制中的常见约束,将PSO算法应用于预测控制滚动优化,得到满足各种约束条件的全局最优解。
(3) 该算法能够快速准确地辨识出对象时变参数,具有满意的控制效果,并具有良好的鲁棒性。
参考文献:
[1] 欧林林, 顾诞英, 张卫东. 基于幅值裕度和相位裕度的PID参数最优整定方法[J]. 控制理论与应用, 2007, 24(5): 837-840.
[2] OU Lin-lin, GU Dan-ying, ZHANG Wei-dong. Optimal tuning method of PID controller based on gain margin and phase margin[J]. Control Theory & Application, 2007, 24(5): 837-840.
[3] Dey C, Mudi R K. An improved auto-tuning scheme for PID controllers[J]. ISA Transactions, 2009, 48(4): 396-409.
[4] Mizumoto I, Ikeda D, Hirahata T, et al. Design of discrete time adaptive PID control systems with parallel feedforward compensator[J]. Control Engineering Practice, 2010, 18(2): 168-176.
[5] Yu D L, Chang T K, Yu D W. A stable self-learning PID control for multivariable time varying systems[J]. Control Engineering Practice, 2007, 15(12): 1577-1587.
[6] Mirkin L. On the extraction of dead-time controllers and estimators from delay-free parametrizations[J]. IEEE Transactions on Automatic Control, 2003, 48(4): 1-11.
[7] 谭文. 时滞过程改进型Smith预估器的整定[J]. 控制理论与应用, 2003, 20(2): 297-301.
TAN Wen. Tuning of modified Smith predictor for processes with time delay[J]. Control Theory & Applications, 2003, 20(2): 297-301.
[8] 张卫东, 何星, 许晓鸣. 自衡和非自衡时滞对象Smith预估器解析设计[J]. 自动化学报, 2000, 26(4): 485-490.
ZHANG Wei-dong, HE Xing, XU Xiao-ming. Smith predictor design for self-regulating and nonself-regulating plants[J]. Acta Automatica Sinica, 2000, 26(4): 485-490.
[9] 朱宏栋, 邵惠鹤. 基于改进IMC的开环不稳定时滞过程控制[J]. 控制与决策, 2005, 20(7): 727-731.
ZHU Hong-dong, SHAO Hui-he. Control for open-loop unstable plus dead-time processes based on modified internal model control[J]. Control and Decision, 2005, 20(7): 727-731.
[10] 董宇, 朱学峰. 基于Dahlin控制器的积分时滞过程控制[J]. 工业仪表与自动化装置, 2005, 2: 29-30.
DONG Yu, ZHU Xue-feng. Control algorithm applied to an integrating process with time delay based on the Dahlin controller[J]. Industrial Instrumentation & Automation, 2005, 2: 29-30.
[11] 席裕庚, 李德伟. 预测控制定性综合理论的基本思路和研究现状[J]. 自动化学报, 2008, 34(10): 1225-1234.
XI Yu-geng, LI De-wei. Fundamental philosophy and status of qualitative synthesis of model predictive control[J]. Acta Automatica Sinica, 2008, 34(10): 1225-1234.
[12] Neshasteriz A R, A. Khaki Sedigh, Sadjadian. Generalized predictive control and tuning of industrial processes with second order plus dead time models[J]. Journal of Process Control, 2010, 20(1): 63-72.
[13] 黄湘云, 朱学峰. 预测控制的研究现状与展望[J]. 石油化工自动化, 2005, 2: 27-31.
HUANG Xiang-yun, ZHU Xue-feng. The situation and prospect of predictive control[J]. Automation in Petro-chemical Industry, 2005, 2: 27-31.
[14] 喻寿益, 曹悦彬, 周璇. 大型立式淬火炉温度分布参数系统辨识算法[J]. 中南大学学报: 自然科学版, 2008, 39(6): 1285-1290.
YU Shou-yi, CAO Yue-bin, ZHOU Xuan. Algorithm of parameter identification for temperature distributed parameter system of large-scale vertical quench furnace[J]. Journal of Central South University: Science and Technology, 2008, 39(6): 1285-1290.
[15] Garnier S, Gautrais J, Theraulaz G. The biological principles pf swarm intelligence[J]. Swarm Intelligence, 2007(1): 3-31.
[16] Parsopoulos K, Vrahatis M. Recent approaches to global optimization problems through particle swarm optimization[J]. Natural Computing, 2002, 1: 235-306.
[17] 王万良, 唐宇. 微粒群算法的研究现状与展望[J]. 浙江工业大学学报, 2007, 35(2): 136-141.
WANG Wan-liang, TANG Yu. The state of art in particle swarm optimization algorithms[J]. Journal of Zhejiang University of Technology, 2007, 35(2): 136-141.
[18] van Ast J, Babuska R, de Schutter B. Particle swarms in optimization and control[C]//Proceedings of the 17th World Congress the International Federation of Automatic Control. Seoul, Korea, 2008: 5133-5136.
[19] Lin W, Liu P X. Parameter estimation for time-varying system based on combinatorial PSO[C]//Proceedings of IFIP International Federation for Information Processing. Santiago, Chile, 2006: 357-368.
(编辑 陈灿华)
收稿日期:2011-05-10;修回日期:2011-07-25
基金项目:国家自然科学基金重点资助项目(60634020,61134006);国家自然科学基金资助项目(61074117)
通信作者:蒋朝辉(1978-),男,湖南衡阳人,博士,从事复杂工业过程建模与控制、工业大系统控制理论与应用等研究;电话:15874291486;E-mail: jjh0423@126.com