基于贝叶斯网络分类器的船舶柴油机冷却系统故障诊断
曾谊晖1, 2,鄂加强3,朱浩3,龚金科3
(1. 中南大学 机电工程学院,湖南 长沙,410083;
2. 湖南涉外经济学院 数控中心,湖南 长沙,410205;
3. 湖南大学 机械与运载工程学院,湖南 长沙,410082)
摘 要:针对船舶柴油机冷却系统故障诊断中信息和知识具有随机性和不确定性的特点,提出基于贝叶斯网络分类器的船舶柴油机冷却系统故障诊断的NB贝叶斯网络故障诊断模型和TAN故障诊断模型。研究结果表明:这2种故障诊断模型均可通过不断积累完善训练样本,自动修正网络结构参数和概率分布参数,提高诊断效果;采用这2种故障诊断模型,正判率在80.57%以上。
关键词:船舶柴油机;冷却系统;故障诊断;贝叶斯网络
中图分类号:TK464 文献标志码:A 文章编号:1672-7207(2010)04-1379-06
Fault diagnosis on cooling system of ship diesel engine based on Bayes network classifier
ZENG Yi-hui1, 2, E Jia-qiang3, ZHU Hao3, GONG Jin-ke3
(1. School of Mechanical and Electrical Engineering, Central South University, Changsha 410083, China;
2. Computer Numberical Control Tooling Center, Hunan International Economics University, Changsha 410205, China;
3. College of Mechanical and Vehicle Engineering, Hunan University, Changsha 410082, China)
Abstract: Due to the randomness and uncertainty of fault diagnosis data from cooling system of ship diesel engine, Naive Bayes (NB) and tree augmented naive Bayes (TAN) diagnostic model on cooling system of ship diesel engine were set up based on Bayes network classifier. The results show that the effectiveness of NB model and TAN model can be enhanced by the self-improvement method. When the training samples are accumulated, these models will modify their structure and probability distribution. The correction rates of the proposed models are higher than 80.57%.
keywords: ship diesel engine; cooling system; fault diagnosis; Bayes network
船舶柴油机工作时,气缸内燃烧气体的高温可达2 000 ℃。任何船舶柴油机都需要进行冷却散热,并要有一整套相应的冷却系统。船舶柴油机并非越冷越好,过分冷却会使柴油机的功率降低。船舶柴油机冷却系统是船舶柴油机中重要的运行设备之一,其故障诊断一直受到人们的广泛重视[1-2]。柴油机冷却系统故障诊断的手段较多,其中,机理分析是目前对柴油机冷却系统进行故障诊断最方便、最有效的手段之 一。柴油机冷却系统的复杂性决定了目前的系统特性参数并未含有足够的故障部位信息[3],因此,以机理分析为主结合试验结果的综合诊断方法得到了深入研究[4-6]。在信息准确、完备的情况下,采用这些方法大多能够得到比较满意的结果。然而,实际上,人们得到的往往是不完备、不精确的结构参数和分布参数,从而需要应用柔性方法来处理。王炳强等[7]采用神经网络对某舰艇柴油机冷却系统进行了故障诊断,但其故障诊断过程存在效率慢、准确度低的缺点,应进一步提高故障诊断的效率和自学习、自适应能力。贝叶斯网络对于解决复杂系统不确定因素引起的故障具有很大的优势,被认为是目前不确定知识表达和推理领域最有效的理论模型[8]。贝叶斯网络用概率测度的权重来描述数据间的相关性,从而解决了数据间的不一致性甚至相互独立的问题,能够方便地处理信息不完备问题[9]。随着贝叶斯网络结构和概率分布技术的发展,贝叶斯网络已经在多个领域中被人们广泛关注,特别是在设备故障诊断等方面得到深入的研究并应用于实践[10-11]。贝叶斯网络分类器是一种典型的基于统计方法的分类模型,它既继承了贝叶斯网络的优点,又具有适于分类的优势。在此,本文作者将贝叶斯网络分类器应用到船舶柴油机冷却系统故障诊断中,结合机理分析和其他试验结果对船舶柴油机冷却系统进行故障诊断,保障船舶柴油机在最适宜的温度状态下工作,达到既能免除零部件损坏和减小其磨损,又能充分发挥它的有效功率的目的。
1 船舶柴油机冷却系统特性参数
船舶柴油机采用淡水作为柴油机的冷却介质,通过冷凝器冷却高温淡水,由经过冷却后的船舶机舱高温淡水再去冷却柴油机,高温淡水以闭式循环方式进行循环使用,其冷却系统简化流程如图1所示。图1中:t1为海水温度;t2为淡水温度;p1为海水压力;p2为淡水压力;Q1为海水流量;Q2为淡水流量。
根据船舶柴油机冷却系统的工艺和其维护管理实际情况,采用连续类型,输入模糊化集合:1:“过大”(或过高);0:“正常”;-1:“过小”(或过低)。具体定义如下。
(1) 海水温度t1:1:>45 ℃;0:20~45 ℃;-1:<20 ℃;
(2) 淡水温度t2:1:>80 ℃;0:70~80 ℃;-1:<70 ℃;
(3) 海水压力p1:1:>0.20 MPa;0:0.10~0.20 MPa;-1:<0.10 MPa;
(4) 淡水压力p2:1:>0.30 MPa;1:0.20~0.30 MPa;-1:<0.20 MPa;
(5) 海水流量Q1:1:>0.130 m3/s;0:0.042~0.130 m3/s;-1:<0.042 m3/s;
(6) 淡水流量Q2:1:>0.065 m3/s;0:0.020~0.065 m3/s;-1:<0.020 m3/s。
2 船舶柴油机冷却系统故障诊断
2.1 贝叶斯网络分类器简介
故障诊断就是建立一个从故障征兆到故障类型的映射函数,其实质是根据属性变量(故障征兆)确定类变量(故障类型)的分类过程。贝叶斯网络分类器以贝叶斯定理为理论基础,巧妙地将事件的先验概率与后验概率联系起来,利用先验信息和样本数据确定事件的后验概率。
令U={X1,X2,…,Xn,C}是离散随机变量的有限集(其中,X1,X2,…,Xn为属性变量;类变量C的取值范围为{c1,c2,…,cm});xi为属性Xi的取值,实例Ii=(x1,x2,…,xn)属于类cj的概率,由贝叶斯定理表示为:
(1)
式中:P(cj)为类cj的先验概率;P(cj│x1,x2,…,xn)为类cj的后验概率,它反映了样本数据对类cj的影响。
图1 船舶柴油机冷却系统框图
Fig.1 Sketch of cooling system of ship diesel engine
根据贝叶斯最大后验准则,对于给定的某一实例Ii=(x1,x2,…,xn),贝叶斯网络分类器选择使后验概率P(cj│x1,x2,…,xn)最大的类cj为该实例Ii的类标签。因此,贝叶斯分类网络器的关键是如何计算P(xi│x1,x2,…,xi-1,cj),各类贝叶斯网络分类器的区别就在于它们以不同的方式求取P(xi│x1,x2,…,xi-1,cj)。
2.1.1 NB网络分类器
朴素贝叶斯(Naive Bayes,NB)网络分类器假定属性变量间相互类条件独立,每个属性节点只与类节点C相关联。这一假设呈指数级降低了贝叶斯网络构建的复杂性,式(1)在NB网络分类器中可表示为:
(2)
尽管条件独立性假定在一定程度上限制了朴素贝叶斯网络的适用范围,然而,研究表明[12]:在实际应用中,即使在属性具有明显依赖性的情况下,朴素贝叶斯网络也表现出相当的健壮性和高效性。与决策树、支持向量机相比,朴素贝叶斯网络具有更高的分类准确度。
2.1.2 TAN网络分类器
TAN(Tree augmented naive Bayesian)网络分类器是在朴素贝叶斯网络基础上的一种改进模型,它假定属性变量间的关系符合限定性树状结构,放松了NB中属性变量间条件独立的假定,允许每个属性节点最多可以依赖于1个属性节点,具有较好的综合性 能,体现了学习效率与分类精度之间的一种适当折中。式(1)在TAN网络分类器中可表示为:
(3)
其中:yi表示xi的父节点集,共分2类:其一只有类节点,其二包括类节点和1个其他属性变量。Friedman等[13]提出了利用条件互信息构造TAN算法。
朴素贝叶斯网络分类器、TAN网络分类器是贝叶斯网络中用于分类的简单而有效的网络模型。
2.2 贝叶斯模型属性参数确定
从船舶柴油机冷却系统的历史故障数据和实验数据中收集大量具有明确结论的船舶柴油机冷却系统故障数据,据故障实例与决策表的划分经验,整理105例样本。取65例样本作为训练集,40例样本作为检测集。船舶柴油机冷却系统故障属性集、故障类、训练样本集如表1~3所示。表3中每一行记录都代表1个船舶柴油机冷却系统故障类型或某一故障类的1个模式。
2.3 贝叶斯网络分类器选择
在不同领域中,贝叶斯网络分类器表现的性能不同。当样本数量较少时,在众多的贝叶斯网络分类模型中,适宜选择NB网络分类器或者TAN网络分类 器[14]。本文分别建立NB和TAN船舶柴油机冷却系统故障诊断模型,并对其性能进行对比分析。
表1 船舶柴油机冷却系统属性集
Table 1 Attribution set of cooling system of ship diesel engine
表2 船舶柴油机冷却系统故障类
Table 2 Fault classes of cooling system of ship diesel engine
表3 船舶柴油机冷却系统训练样本集
Table 3 Train sample set of cooling system of ship diesel engine
2.4 贝叶斯网络分类器结构参数和概率参数的确定
贝叶斯网络分类器参数包括结构参数和概率参数,参数设置可根据专家经验确定也可从样本集中通过学习获得。通常,由领域专家给出属性变量和类变量的因果图,或者从样本集中学习网络结构。给出众多节点变量的条件概率参数,此时,可以通过学习样本集得到条件概率参数。本文首先按照选定的模型,从样本集中学习获得结构参数和概率参数,然后,依据可靠性指标对模型参数进行调整,实现专家经验与样本知识的结合。
2.4.1 朴素贝叶斯网络
将类变量C作为所有属性变量Xi的父节点,用样本的最大似然估计值作为P(Xi=xi|ck)的估计值,建立船舶柴油机冷却系统故障诊断NB分类模型,并依据其可靠性指标对先验概率进行调整。故障诊断NB模型如图2所示。
2.4.2 TAN模型
依照Friedman等[13]提出的利用条件互信息构造TAN(Tree augmented naive)的算法,建立船舶柴油机冷却系统故障诊断TAN模型,并利用其可靠性指标对先验概率进行调整。TAN模型如图3所示。
2.5 船舶柴油机冷却系统故障诊断的自学习
船舶柴油机冷却系统故障诊断贝叶斯网络模型将故障类型视为类节点的不同状态,因此,具有故障类节点和属性节点易于扩展的优势。将经过实践验证的诊断实例添加到样本集中,调整结构参数和概率参数,寻找最能匹配给定样本集的网络。随着样本集的不断丰富,能够自动提高故障诊断能力和准确性,实现自学习。
图2 船舶柴油机冷却系统故障诊断NB模型
Fig.2 Fault diagnostic NB model of cooling system of ship diesel engine
图3 船舶柴油机冷却系统故障诊断TAN模型
Fig.3 Fault diagnostic TAN model of cooling system of ship diesel engine
3 船舶柴油机冷却系统故障诊断分析
在实际工作中,常常无法获得完备信息,从而影响诊断方法的直接判断。贝叶斯分类既不是用1个或几个属性决定分类,也不是把1个对象绝对地指派给某一类,而是通过现有证据计算样本属于某一类的后验概率,具有最大后验概率的类便是该对象所属的 类[11]。因此,贝叶斯网络分类模型更具优势,它可直接处理不完备信息,能够获得较高正判率。
然而,应用贝叶斯网络分类器进行故障诊断并非在任何情况下都很理想,研究表明:在测试样本属性信息缺失较少的情况下正判率较高,但当属性信息缺失较多时,由于受非关键属性不完整的干扰,模型的正判率明显下降。应用粗糙集技术去除冗余信息后进行诊断,可以有效提高贝叶斯网络分类器的正判 率。在判别故障类型时,当几个故障类的后验概率相差很小时,给出后验概率相近的几个故障类,同时给出增加属性信息进一步计算的请求,是一种切实可行的方法。
在建立贝叶斯网络分类器模型后,应用贝叶斯网络分类器进行船舶柴油机冷却系统故障诊断。具体步骤如下。
步骤1 检查测试样本属性缺失情况,若样本较少(本文所建模型以小于5为标准),则执行步骤3。
步骤2 搜索最佳的最小条件属性集,使最小条件属性集在样本中的属性值空值最少,并且属性个数最多。若该最小条件属性集在样本中空值属性个数大于1,则提示缺少属性信息,请求增加属性信息后再进一步计算,否则,将测试样本中不属于该最小条件属性集的属性置空。
步骤3 应用贝叶斯网络分类器进行诊断,获得分类结果及各个故障分类的后验概率。
步骤4 检查后验概率,若不存在与步骤3中分类结果的后验概率相近的其他故障类型,则直接给出诊断结果,否则,同时给出这几个后验概率相近的故障类型,并请求增加属性信息后再进行计算。
3.1 属性信息缺失较少时的故障诊断
根据表3中的规则,从待检测样本中产生所有缺失单个属性即只有8个确定属性值的测试样本150例,随机产生缺失2~3个属性值的测试样本各300例。应用上述船舶柴油机冷却系统故障诊断NB和TAN模型分别对产生的测试样本进行诊断,并与实验结果进行验证,诊断结果见表4。从表4可见:当样本缺失属性数量分别为0,1,2和3时,NB模型正判率分别为100%,100%,97.5%和95.2%,TAN模型正判率分别为100%, 100%,96.8%和92.3%;应用粗糙集方法进行诊断,正判率分别为100%,100%,78.9%和74.5%。当随机缺失属性值大于6时,NB模型和TAN模型的正判率均小于80%。
表4 不完备测试样本诊断结果
Table 4 Diagnosing results of testing samples with incomplete attribution
3.2 属性信息缺失较多时的故障诊断
利用粗糙集理论对表3中属性进行约简,得出最小条件属性集如{X1,X2,X3},{X4,X5,X6},{X1,X2,X6}和{X4,X5,X3}等。结合最小条件属性集与表3,从待检测样本中产生缺失一类关键属性的测试样本210例。如样本{X1=1,X2=1,X5=0}就是1例缺失一类关键属性的测试样本。使用船舶柴油机冷却系统故障诊断NB模型和TAN模型分别对待检测样本进行诊断,诊断结果对比结果见表5。从表5可见:NB模型和TAN模型的正判率分别为81.78%和80.57%。使用粗糙集的决策表进行诊断,正判率只有63.51%。船舶柴油机冷却系统故障诊断结果与试验结果相符。结合粗糙集技术的船舶柴油机冷却系统故障诊断贝叶斯网络方法中,NB和TAN模型具有较高的正判率和较强的不确定性处理能力,其中NB模型的性能略优于TAN模型的性能。
表5 最小条件属性集缺失的诊断结果
Table 5 Diagnosing results on testing samples with a reduced attribution absent
4 结论
(1) 针对船舶柴油机冷却系统故障诊断中属性变量常常不完备、已有故障诊断方法处理不完备信息存在不足的状况,提出了基于贝叶斯网络分类器的船舶柴油机冷却系统故障诊断方法,建立了船舶柴油机冷却系统故障诊断NB模型和TAN模型。
(2) 验证了不完备信息条件下基于贝叶斯网络分类器的船舶柴油机冷却系统故障诊断方法的判断正判率在80.57%以上,表明该方法正确。其NB模型和TAN模型都具有较强的处理不完备信息的能力。
(3) 在训练样本数量不多时,基于贝叶斯分类器的船舶柴油机冷却系统故障诊断方法适于选择NB模型和TAN模型。这2种模型能够随着样本集的不断完善自动学习网络结构参数和概率分布参数,实现自学习功能。
参考文献:
[1] 何文山. 船舶柴油机[M]. 北京: 人民交通出版社, 1997: 10-18.
HE Wen-shan. Ship diesel engine[M]. Beijing: People Transportation Press, 1997: 10-18.
[2] 鄂加强. 智能故障诊断及其应用[M]. 长沙: 湖南大学出版社, 2006: 178-210.
E Jia-qiang. Intelligent fault diagnosis and its application[M]. Changsha: Hunan University Press, 2006: 178-210.
[3] 操召发. 基于模糊逻辑推理故障智能诊断系统及其仿真研究[D]. 上海: 上海海事大学物流学院, 2004: 51-65.
CAO Zhao-fa. Intelligent fault diagnosis system and its simulation based on fuzzy logic inference[D]. Shanghai: Shanghai Maritime University. Logistics Engineering College, 2004: 51-65.
[4] 毕小平, 许翔, 黄小辉, 等. 坦克柴油机冷却系统使用可靠性特征量估计[J]. 内燃机工程, 2007, 28(6): 37-40.
BI Xiao-ping, XU Xiang, HUANG Xiao-hui, et al. Estimation of reliability character parameters of cooling system in tank diesel engines[J]. Chinese Internal Combustion Engine Engineering, 2007, 28(6): 37-40.
[5] 刘翼俊, 陈群, 李骏, 等. 车用柴油机冷却系统的CFD分析[J]. 内燃机学报, 2003, 21(2): 125-129.
LIU Yi-jun, CHEN Qun, LI Jun, et al. Automotive diesel engine water jacket CFD analysis[J]. Transactions of CSICE, 2003, 21(2): 125-129.
[6] 喻方平, 金华标, 常勇, 等. 船舶柴油机状态监测及故障诊断仪设计[J]. 武汉理工大学学报: 交通科学与工程版, 2002, 26(3): 312-314.
YU Fang-ping, JIN Hua-biao, CHANG Yong, et al. Design of the device of fault diagnosis and state supervising for marine diesel engine[J]. Journal of Wuhan University of Technology: Transportation Science and Engineering, 2002, 26(3): 312-314.
[7] 王炳强, 沈精虎, 赵景波. 某舰艇柴油机冷却系统智能故障诊断系统设计[J]. 计算机测量与控制, 2009, 17(5): 909-910, 920.
WANG Bing-qiang, SHEN Jing-hu, ZHAO Jing-bo. Design of an intelligent fault diagnosis system of a naval vessel’s cooling system of diesel engine[J]. Computer Measurement & Control, 2009, 17(5): 909-910, 920.
[8] Nilsson N. Artificial intelligence: A new synthesis[M]. USA: Morgan Kaufmann Publishers, 1998: 510-513.
[9] 王华伟, 周经伦, 何祖玉, 等. 基于贝叶斯网络的复杂系统故障诊断[J]. 计算机集成制造系统, 2004, 10(2): 230-234.
WANG Hua-wei, ZHOU Jing-lun, HE Zu-yu, et al. Fault diagnosis of complex system based on bayesian networks[J]. Computer Integrated Manufacturing Systems, 2004, 10(2): 230-234.
[10] 李俭川, 胡茑庆, 秦国军, 等. 贝叶斯网络理论及其在设备故障诊断中的应用[J]. 中国机械工程, 2003, 14(10): 896-900.
LI Jian-chuan, HU Niao-qing, QIN Guo-jun, et al. Bayesian network and its applications for device fault diagnosis[J]. China Mechanical Engineering, 2003, 14(10): 896-900.
[11] 赵春华, 严新平, 赵新泽. 基于贝叶斯网络的内燃机故障诊断研究[J]. 武汉理工大学学报: 交通科学与工程版, 2005, 29(3): 334-338.
ZHAO Chun-hua, YAN Xin-ping, ZHAO Xin-ze. Engine fault diagnosis based on Bayesian network[J]. Journal of Wuhan University of Technology: Transportation Science and Engineering, 2005, 29(3): 334-338.
[12] HUANG Jin, LU Jing-jing, Charles X Ling. Comparing naive Bayes, decision trees, and SVM with AUC and accuracy[C]//Proceeding of the 3rd IEEE International Conference on Data Mining. Melbourne, Florida, USA, 2003: 553-556.
[13] Friedman N, Geiger D, Goldszmidt M. Bayesian network classifiers[J]. Machine Learning, 1997(29): 131-163.
[14] 王双成, 苑森淼, 王辉. 基于类约束的贝叶斯网络分类器学习[J]. 小型微型计算机系统, 2004, 25(6): 968-971.
WANG Shuang-cheng, YUAN Sen-miao, WANG Hui. Learning Bayesian network classifiers restricted by class variable[J]. Mini-micro Systems, 2004, 25(6): 968-971.
收稿日期:2009-10-21;修回日期:2009-12-28
基金项目:湖南省教育厅优秀青年基金资助项目(08B042)
通信作者:曾谊晖(1972-),男,湖南湘潭人,博士研究生,副教授,高级访问学者,从事数控、材料和自动控制的研究;电话:0731-88118922;E-mail: 774158154@qq.com
(编辑 陈灿华)