基于光谱再现的颜色印刷重构方法
管力明1, 2,林剑2,胡更生2
(1. 西安电子科技大学 机电工程学院,陕西 西安,710071;
2. 杭州电子科技大学 新闻出版学院,浙江 杭州,310018)
摘要:在分析光谱颜色再现方法和特点的基础上, 结合最小二乘支持向量机小样本、非线性和高维数的特点,提出基于最小二乘支持向量机的颜色光谱重构方法。针对最小二乘支持向量回归机中参数选择的盲目性,结合和声搜索算法具有良好寻优能力和易实现的特点,引入粒子群算法中个体调整参考群体最优值的思想,提出一种全局和声搜索算法,并利用该算法对最小二乘支持向量机中参数进行寻优。实验仿真表明:提出的全局和声搜索算法具有较高的寻优性能,所建立的全局和声搜索优化的最小二乘支持向量机印刷颜色光谱重构方法具有较高的 精度。
关键词:和声搜索;最小二乘支持向量机;光谱重构;反射率
中图分类号:O6571.3 文献标志码:A 文章编号:1672-7207(2011)08-2345-06
Method of printing rebuild based on color spectrum reproducing
GUAN Li-ming1, 2, LIN Jian2, HU Geng-sheng2
(1. School of Electronic Engineering, Xidian University, Xi’an 710071, China;
2. School of Printing, Hangzhou Dianzi University, Hangzhou 310018, China)
Abstract: Based on the analysis of the characteristics in spectral color reproduce, and combined with the features of small samples, nonlinear and high-dimensional which the least squares support vector machine (LSSVM) has, a model of ink preset in offset printing based on LSSVM was proposed. According to the blindness of parameter choice in LSSVM, and combined with the features of good optimization ability and easy completion of harmony search algorithm, a global harmony search (GHS) algorithm, which brings in the ideal of swarm intelligence, was brought forwarded, and further used to optimize the parameters in LSSVM. The experimental simulation shows that the GHS has a better performance, and the established global harmony search-based least squares support machine (GHS-LSSVM) model has high precision in spectrum rebuild.
Key words: harmony search; least squares support vector machine; spectrum rebuild; reflectivity
基于光谱的颜色复制,其技术核心是实现颜色的光谱数据描述,即采用不同波段范围内的光谱反射率或透射率来唯一标定颜色。颜色的光谱数据在任何条件下均是唯一的,光谱复制的颜色在视觉宽容度之内和大多数照明条件之下都是恒定不变的,这就保证了复制的颜色在不同的照明和观察条件下都能够精确呈现。基于光谱的颜色复制方法可从根本上消除传统印刷复制的缺陷,增加颜色叠加的自由度,扩大印刷色域,消除或最低限度降低同色异谱的影响,进而实现颜色的真实复制[1-3]。印刷中的颜色光谱重构,其实质是建立呈色油墨的网点面积率与最终复制品上可测量的颜色物理量之间的映射关系,它的核心思想是建立光谱反射率与呈色条件之间的回归函数。如何建立准确高效的光谱反射率重建算法,一直是光学研究领域的热点问题。目前对于油墨叠印色最常用的光谱重建方法是利用Kubelka-Munk混浊介质混色模型或其改进模型[4-5],其最大的问题是在建立颜色预测模型时未能充分考虑到实际印刷中影响颜色形成的各因素。Heikkinen等[6]提出利用正则化神经网络来求解以上回归函数,神经网络方法具有较强的非线性映射能力,但实现方式复杂,网络训练时间长,很难得到实际应用。支持向量机(Support vector machine, SVM) 回归较好地解决了小样本、非线性、高维数和局部极值等问题,具有较强的泛化能力,但是当学习样本数目较大时,其实时性无法得到保证。Suykens等[7]提出了最小二乘支持向量机(Least squares support vector machine,LSSVM),通过把SVM 的二次规划问题转换为求解线性方程组问题,简化了计算复杂度,但其参数主要靠试凑,难以得到最优值。目前在参数优化方面,遗传算法和粒子群算法应用较为广泛,但是粒子群算法和遗传算法由于只考虑了个体和群体最优值,在算法后期的局部搜索能力差, 反馈信息利用不充分,在求解复杂问题时,容易出现“早熟”现象。和声搜索(Harmony search, HS)是由Geem等[8-10]提出的一种元启发式寻优算法,由于其良好的全局寻优能力而逐渐被应用于解决结构优化设计和参数寻优问题。在此,本文作者结合和声搜索算法良好的寻优性能,提出基于和声搜索算法参数优化的LSSVM模型,用于实现光谱反射率曲线重构。
1 全局和声搜索优化的最小二乘支持向量机模型
1.1 最小二乘支持向量机算法
非线性支持向量回归机的主要思想是通过非线性映射f(?),将输入数据投影到高维特征空间(Hilbert空间),从而将低维非线性回归问题转化为高维特征空间中的线性回归问题。给定N个样本点{xi,yi},其中,,,。构造最优决策函数为:
(1)
式中:h为高维特征空间维数;b为偏置量。根据问题求解目标和结构风险最小化原则,式(1)需满足如下 条件:
(2)
根据LS-SVM算法,定义误差损失函数为误差的二次项,上述问题可转为:
(3)
式中:γ为惩罚系数,控制对超出误差e的样本的惩罚程度。用拉格朗日乘子法求解这个具有等式约束的二次规划问题,定义Lagrange函数:
(4)
式中:αi为Lagrange乘子。 通过对式(4)中w,b,ei和αi分别求偏导,可得下式所示的矩阵方程。
(5)
式中:y=[y1,y2,…,yN]T,1=[1,1,…,1]T, α= [α1,α2,…,αN]T,Ω为核矩阵;且Ωij=K(xi,xj);K为定义的核函数。对于非线性回归问题,核函数可以实现到高维空间的映射。由Mercer条件可得:
(6)
式中:i=1,2,…,N;j=1,2,…,N。
由式(5)可以求得αi和b,结合式(1)可得最小二乘支持向量机函数模型为:
(7)
由于高斯径向基核函数(如式(8)所示)具有良好的可分性和局部性,通常用来作为核函数[11]。
(8)
LSSVM中所有的训练样本都认为是支持向量,与支持向量机相比,LSSVM用等式约束代替不等式约束,求解过程变为求解一组等式方程(如式(5)所示),而不是求解二次规划问题,所以,求解速度更快。
1.2 全局和声搜索算法
和声搜索算法通过模拟乐队调音直到实现完美和声的过程,并由此引申出解决一般优化问题的寻优策略。但是,原始和声搜索算法[8]中各候选解的“调音”过程相互独立,不存在信息共享机制,算法效率受到限制。对此,Omran等[12]试图借用粒子群算法的思想来提高和声搜索算法的性能,但是,该算法简单地将群体最优解赋给当前新解,使得原始算法中“调音”过程被淡化,造成算法更易陷入局部最优[13]。受此启发,本文提出一种全局和声搜索算法,该算法引入粒子群算法中每个粒子根据群体最优位置进行调整的思想,在“调音”过程中参考和声库中“最优美和声”进行,但保留了音调调节参数,从而保证了“调音”过程不被淡化。全局和声搜索算法描述如下。
Step 1 参数初始化。初始化和声记忆库规模(SHM)、记忆库取值概率(RHMC)、音调调节概率(RPA)、音调调节范围(wb)、迭代次数(IN)等参数。
Step 2 和声记忆库初始化。原始和声搜索算法直接初始化生成规模为SHM的和声库,和声库中保存着问题候选解,假设存在n维候选解向量,每个候选解初始化为每一维向量取值范围内的随机值,即, 其中,, 。本算法采用的初始化流程为:
(1) 随机生成规模为2×SHM的和声库;
(2) 计算和声库中各候选解的适应度fit(xk),并按照适应度值排序;
(3) 从中选取适应度值较优的前SHM个候选解作为初始和声库。
(4) 由于和声库的初始化步骤对算法影响较大,这样可以使和声库中更多地包含各局部最优解,从而有利于算法更快找到全局最优解。
Step 3 生成一个新解。这个过程被称为“即席创作”。 生成规则为:
生成两个在[0,1]上均匀分布的随机数r1和r2,再从记忆库中随机选取1个解xj。
(1) 若r1<RHMC且r2≥RPA,则;
(2) 若r1<RHMC且r2<RPA,则 ;
(3) 若r1≥RHMC,则。
其中:为和声库中最优候选解对应的第i维解向量。这里既参考了和声库中最优候选解的值,又保留了wb参数,在一定程度上实现了最优候选解和新解之间的信息共享。
Step 4 更新和声记忆库。若新解适应度fit(x′)要优于和声库中候选解的适应度值,则用新解x′替代库中适应度最差的解。
Step 5 检查结束条件。检查是否满足结束条件,若不满足,则转回Step 3。
1.3 全局和声优化的最小二乘支持向量机模型
最小二乘支持向量机在建模过程中,惩罚系数γ和高斯径向基核函数中参数δ的选择完全依靠先验知识来选定,并且选定的参数会直接影响其在实际应用过程中的回归性能。因此,本文考虑利用提出的全局和声搜索算法来寻找最优参数γ和δ。将这2个参数作为和声搜索中二维候选解向量的值,适应度函数表达式如下式所示,具体算法流程如图1所示。
(9)
式中:x(t)和y(t)分别为第t次迭代时训练样本的输入和输出向量。
图1 基于全局和声搜索的最小二乘支持向量机参数优化流程
Fig.1 Flowchart of parameter optimization based on GHS-LSSVM
2 颜色光谱重构问题描述
2.1 光谱反射率与物体颜色
光照射到物体上时,部分光被反射,从色彩的观点来说,每一个反射物体对光的反射效应,能够以光谱反射率分布曲线来描述。光谱反射率R(λ)定义为:在波长λ的光照射下,样品表面反射的光通量Φr(λ)与入射光通量Φi(λ)之比,即
(10)
由式(10)可知:如果知道了物体的光谱反射率,即物体对不同波长的光反射的光通量与入射的光通量之比,就能预测物体在各种照明条件以及各种颜色系统下的颜色表示。物体表面的色彩与光源的光谱成分有极大的关系。用于照明的光源色往往是极复杂的,可能是单色光,也可能是复色光。就复色光而言,其光谱成分也可能不相同。物体对入射光的吸收、反射、透射的光学特性虽然不受光源的影响,但当光源的光谱成分发生变化时,必然影响到物体的反射或透射光的光谱成分,从而使物体的表面颜色随着光源色的变化而变化。光谱反射率可以精确地描述物体的颜色,对色彩的定量描述有重要意义。
2.2 基于GHS-LSSVM的颜色重构模型
光谱反射率函数R(λ)通常表示为波长400~700 nm之间的n个等距采样点上的反射率向量[R1(λ),R2(λ),…,Rn(λ)]。对于CMYK四色印刷方式,设X= [C,M,Y,K]T为4维的CMYK响应值向量,Y= [R1(λ),R2(λ),…,Rn(λ)]T是n维的光谱响应向量,光谱反射率重构问题就是把样本的CMYK响应值作为输入变量,把相应的光谱反射率作为输出变量,然后建立X与Y之间的映射关系:
(11)
由于上述映射关系的输出是n维变量,一种建立映射关系的方法是要在每个波长采样点分别建立回归函数yi=fi(X),当给定一组新的CMYK响应值输入时,预测的光谱反射率向量由[f1(X),f2(X),…,fn(X)]T得出。这种方法的缺点是需要很多训练样本来保证每个回归函数的精确性和稳定性。
为了提高模型的泛化性,GHS-LSSVM光谱反射重构模型考虑采用以把样本的CMYK响应值与采样波长λ共同作为输入,把相应的光谱反射率R作为光谱重构模型输出,其输入输出模型为:
(12)
若有训练样本集:
其中:是CMYK响应值,为光谱反射率向量。根据上述重构模型,样本集P重新设置为:
(13)
根据式(12)确定的光谱重构模型,响应值(C0,M0,Y0,K0)对应的光谱反射率函数为f(C0,M0,Y0,K0,λ)。对于从重新设置的样本集P中直接构造出式(12)中的4维组合反射率函数,然后,对于任意的响应值(C0,M0,Y0,K0),可以利用f给出其对应的光谱反射率函数:
(14)
3 仿真实验
3.1 参数寻优
实验样本采用如下印刷条件印制的四色印刷色谱样品:GATF TestForm 4.1测试控制标版,BlackMagic数码打样,炬光热敏CTP版,天津天狮油墨,海德堡单张纸印刷机CD102-4,UPM优光铜版纸。印刷色谱样品用黄(Y)、品红(M)、青(C)和黑(K)四色油墨,以黄、品红和青各色油墨网点面积0~100%的变化,分成0,5%,10%,20%,30%,40%,50%,60%,70%,80%,90%和100%共12个等级。在每页色谱上,以品红、青油墨分别作横向和纵向的变化,用每一等级的黄色油墨依次套印在每页色谱上而形成由三原色组成的印刷色谱,这样可得到12×12×12=1 728种不同的色块;在上述三色色谱的基础上,再铺上0,5%,10%,20%,40%和60%的黑色平网,共计形成10 368个同步颜色的色块。在全部色块样本中随机取144个色块作为建模样本,并随机分成建模集和预测集,建模集有103个样本,预测集有41个样本。样本的光谱反射率由X-Rite530分光光度计测出,所测波长范围为400~700 nm,间隔为10 nm。
利用全局和声搜索算法对最小二乘支持向量机中参数γ和δ进行寻优,不同寻优算法在同一平台下运行可得如表1所示结果,其中IHS为文献[14]中所提算法,HS为原始和声搜索算法,GHS为本文所提算法,所有结果均取10次正常寻优的平均值。针对同一问题,不同算法迭代1 000次后,群体平均适应度和最优个体适应度变化曲线如图2和图3所示。从图2和图3可以看出:全局和声搜索算法与其他算法相比,和声搜索算法在收敛性能上具有较大的提高,更容易收敛到全局最优值。
图2 平均适应度曲线比较
Fig.2 Comparison of average fitness
图3 最优适应度曲线比较
Fig.3 Comparison of best fitness
3.2 光谱重建仿真
结合前面全局和声搜索算法寻优所得到的最优参数,利用GHS-LSSVM模型对测试样本进行测试,图4所示为部分测试样本光谱反射率重构结果曲线与期望光谱反射率曲线的比较图。
对于光谱重构精度,定义如下2个性能指标。
(1) 均方根误差:;
(2) 平均绝对误差:。
式中:M为测试样本数;yi和分别表示实际输出值和期望输出值。通过随机生成5组参数,对同一测试样本集输出重构值,与GHS-LSSVM模型输出结果进行比较,结合图4中各部分色卡的重构效果,结果如表1所示。从表1可以看出:GHS-LSSVM与其他状态下的重构曲线相比,在精度上有较大提高。
图4 部分色卡的光谱曲线重构比较
Fig.4 Spectral curves rebuilt with part color cards
表1 不同参数状态下性能指标比较
Table 1 Comparison of state performance index with different parameters
4 结论
(1) 引入粒子群算法中每个粒子根据群体最优位置进行调整的思想,提出了一种全局和声搜索算法。以标准印刷色谱中随机抽取的144个色块作为实验样本。仿真结果表明:全局和声搜索算法与其他改进和声搜索算法相比具有更好的寻优性能,并且与粒子群算法相比,算法更为简单,执行速度更快。
(2) 利用全局和声搜索算法对最小二乘支持向量机模型中的惩罚系数γ和高斯径向基核函数中参数δ进行优化,给出了优化流程,建立了GHS-LSSVM 模型。
(3) 建立了基于GHS-LSSVM的颜色光谱重构模型,并针对在海德堡单张纸印刷机CD102-4实际印刷所得色谱样本进行测试,结果表明寻优所得参数建立的重构模型与其他参数状态下的重构模型相比,预测值具有更高的精度。
参考文献:
[1] 王海文, 李杰, 万晓霞. 基于光谱的印刷颜色复制技术研究[J]. 包装工程, 2008, 29(4): 40-42, 95.
WANG Hai-wen, LI Jie, WAN Xiao-xia. Research on the printing color reproduction technology based on spectral imaging[J]. Packaging Engineering, 2008, 29(4): 40-42, 95.
[2] Shen Hui-liang, Xin J H, SHAO Si-jie. Improved reflectance reconstruction for multispectral imaging by combining different techniques[J]. Optics Express, 2007, 15(9): 5531-5536.
[3] Shimano N. Recovery of spectral reflectances of objects being imaged without prior knowledge[J]. IEEE Transactions on Image Processing, 2006, 15(7): 1848-1856.
[4] Berns R S, Mohammadi M. Single-constant simplification of Kubelka-Munk turbid-media theory for paint systems: A review[J]. Color Research and Application, 2007, 32(3): 201-207.
[5] Stigell P, Miyata K, Hauta M K.Wiener estimation method in estimation of spectral reflectance from RGB images[J]. Patten Recogn Image Anal, 2005, 15: 327-329.
[6] Heikkinen V, Jetsu T, Parkkinen J. Regularized learning framework in the estimation of reflectance spectra from camera responses[J]. J Opt Soc Am A, 2007, 24: 2673-2683.
[7] Suykens J A, Gestel T V, Brabanter J D. Least square support vector machines[M]. Singapore: World Scientific Publishers, 2002: 22-25.
[8] Geem Z W, Kim J H, Loganathan G V. A new heuristic optimization algorithm: Harmony search[J]. Simulation, 2001, 76(2): 60-68.
[9] Geem Z W, Kim J H, Loganathan G V. Harmony search optimization: Application to pipe network design[J]. Int J Modell Simulation, 2002, 22(2): 125-133.
[10] Lee K S, Geem Z W.A new meta-heuristic algorithm for continuous engineering optimization: Harmony search theory and practice[J]. Appl Mech Eng, 2005, 194: 3902-3933.
[11] 赵莹. 支持向量机中高斯核函数的研究[D]. 华东师范大学理工学院, 2007: 11-20.
ZHAO Yin. The study on gauss kernel function in support vector machine[D]. Shanghai: East China Normal University. School of Science and Engineering, 2007: 11-20.
[12] Omran M G, Mahdavi M. Global-best harmony search[J]. Applied Mathematics and Computation, 1998, 198(2): 643-656.
[13] Wang Chia-ming, Huang Yin-fu. Self-adaptive harmony search algorithm for optimization[J]. Expert Systems with Applications, 2010, 37: 2826-2837.
[14] Santos L D, Andrade D L. An improved harmony search algorithm for synchronization of discrete-time chaotic systems[J]. Chaos, Solitons & Fractals, 2009, 41: 2526-2532.
(编辑 杨幼平)
收稿日期:2010-08-03;修回日期:2010-11-20
基金项目:国家自然科学基金资助项目(60672063);中国包装总公司科研计划项目(2007-kj02)
通信作者:管力明(1968-),男,北京人,教授,从事胶印质量检测、智能仪器的研究;电话:0571-86878503;E-mail:glm@hdu.edu.cn