伤城文章网 > 自然科学 > 过程控制系统执行器与传感器故障诊断研究

过程控制系统执行器与传感器故障诊断研究


河北工业大学 硕士学位论文 过程控制系统执行器与传感器故障诊断研究 姓名:刘志伟 申请学位级别:硕士 专业:检测技术与自动化装置 指导教师:梁秀霞 20070301

河北工业大学硕士学位论文

过程控制系统执行器与传感器故障诊断研究
摘 要

随着技术的发展,控制系统越来越复杂,因而及时、准确地诊断出系统的故障,保证 其平稳可靠地运行也就变得越来越重要。 本文介绍了故障诊断的任务, 研究了控制系统中 存在的故障,以及它们的数学表示方法。执行器和传感器作为控制系统的重要部件,经常 工作在高温、高压和具有腐蚀等恶劣工作环境中,是比较容易出故障的部件。故障往往对 控制性能产生直接的影响,甚至造成过程的振荡,最终导致产品不合格等严重后果。因此 提高执行器与传感器本身的可靠性, 及时发现其运行过程中存在的故障, 是保障过程控制 的稳定经济运行的要求。 论文总结了近年来传感器与执行器故障诊断领域的最新研究成果, 对两大类基本的诊 断方法进行了深入研究,首先应用观测器原理实现了控制系统传感器与执行器故障的诊 断。 基于神经网络控制系统的故障诊断分为两部分,一是故障样本数据及检验数据的采 集;二是故障诊断。在故障样本数据及检验数据的采集过程中,首先建立了控制系统的数 学模型, 人为地让控制系统发生各种故障, 从而采集到各种故障数据, 经过归一化处理后, 作为训练神经网络的样本数据;同时,也采集检验数据,用以检验训练出的神经网络是否 能够起到故障诊断的作用。 利用遗传算法和神经网络的特点和优点,将两者结合在一起而形成了 GA-BP 算法,并 建立了用于过程控制故障智能诊断的遗传一神经网络模型。 该模型继承了传统遗传算法的 优点, 兼具神经网络强大的函数逼近功能, 同时又克服了传统神经网络优化方法易陷入局 部最优解的缺陷。 实例的训练和模式识别结果表明: 实数编码的遗传算法优化的神经网络 模型模式识别精度较高,适合于过程控制系统的故障诊断。 关键字:故障诊断,过程控制系统,观测器,神经网络,遗传算法

I

过程控制系统执行器与传感器故障诊断研究

THE FAULT DIAGNOSIS RESEARCH OF ACTUATOR AND SENSOR IN PROCESS CONTROL SYSTEM ABSTRACT
With development of technology, control system is more and more complicated, so diagnosing fault becomes more and more important, diagnosing accurately fault in time and ensuring that system runs reliably. The paper introducing the tasks of fault diagnosis, discuss the fault in the control system and their mathematical representing methods. The Actuator and sensor, as the performance terminating parts of the control system, usually work under the formidable circumstance with high temperature, high pressure, and having corrosion etc, is easier to make faults. The actuator and sensor’s faults always make direct effect in the control performance; even make oscillation in the process, ultimately lead to the serious consequence as sub-quality products etc. So the demands of ensuring the control process operate stably and economically, is raising the performer itself reliability, finding the fault in the operation process in time. Summarizes the achievements up to the minute in the sensor fault diagnoses field in recent years, and makes deeply study on the two basic diagnose methods. Realizing the sensor fault and actor diagnoses of control system by using observer principle. In the control system of neural network, the fault diagnosis consists two parts: one is the collection of fault sample data, the other is fault diagnosis. So during the collection of fault sample datas and checking datas,the paper sets up the mathematics model of control system first. We cause all kinds of fault in the control system, and then collect a variety of fault datas. After unitarily dealing, the fault datas server as the sample datas of training neural network. At the same time, according to the collection of checking datas, which are used to examine whether the trained neural network have the function of fault diagnosis. In this paper, the author combines an artificial neural network with the genetic algorithms and forms a new algorithm, GA-BP algorithm, and establishes a GA-ANN model for the intelligent fault diagnosis of the process control system, which is used the features and virtues of ANN and GA. The model takes the advantages of traditional neural network and genetic algorithms, and gets rid of their defects. In order to demonstrate the feasibility of the model, a case of the electro-hydraulic servo valve's faults are selected for discussion. In the case, the simulation results are in good agreement with the measured data. This shows that the method presented in this paper is feasible in simulating the faults of process control system. KEY WORDS: fault diagnosis, process control system, observer, neural network, genetic algorithms

II

河北工业大学硕士学位论文

第一章 绪论
§1-1 课题研究背景和意义
1-1-1 课题研究背景与意义 随着科学技术的不断推进,现代系统正朝着大规模、复杂化的方向发展。在这样的一类系统中, 一旦发生事故就有可能造成人员和财产的巨大损失。1986 年 4 月 26 日,前苏联切尔诺贝利核电站发 生了核泄漏事件,当场两人死亡,造成了十分严重的后果,恶劣的影响至今挥之不去。时至今日,参 加救援工作的 83.4 万人中,已有 5.5 万人因此丧生,7 万人成为残疾,30 多万人受放射伤害死去。从 1998 年 8 月到 1999 年 5 月的短短的 1 个月间,美国的 3 种运载火箭“大力神”“雅典娜”“德尔他” 、 、 共发生了 5 次发射失败,直接经济损失达到 30 多亿美元,迫使美国航天局于 1999 年 5 月下令停止了 所有的商业发射计划,美国的航天计划遭受了严重的打击。1986 年“挑战者”升空后爆炸的余音还尚 未消失,2003 年“哥伦比亚”号航天飞机又在德克萨斯的上空解体。所发生的一系列恶性事件,迫使 人们想办法去提高现代系统的可靠性与安全性。除了航空、航天领域之外,石油化工生产过程、医药 制造行业、稀土元素的提炼工艺等等工业过程控制领域中,系统的可靠性和安全性也同样非常重要。 系统拥有高的可靠性和安全性意味着操作人员的人身安全能得到更好的保障,同时也能提高生产效率 和经济效益。如交通运输领域,各类交通事故频发,在紧急情况下应急处理措施的优劣,关系着司乘 人员的人身安全。 1-1-2 控制系统故障诊断的重要性 自Wiener于40年代提出控制论到现在, 自动控制技术已经广泛应用于工业生产、 航空航天、 机器人、 核电站等各种领域。 所谓自动控制, 就是应用自动化仪表或控制装置代替人工自动地对设备或过程进行 控制,使之达到预期的状态或性能要求。而自动控制系统则是指由自动检测仪表、自动调节器、执行器 以及包括被控对象在内的,各部分组合在一起的一个系统。随着生产水平和科学技术的不断发展,现代 控制系统的规模日趋大型化、复杂化和系统化,自动化的程度也越来越高。 为了提高控制系统的可靠性、 维修性和安全性, 人们迫切需要建立一个监控系统来监督整个控制系 统的运行状态,不断检测系统的变化和故障信息,进而采取必要的措施,防止系统灾难性事故的发生。 而其前提是监控系统必须具有在线检测和诊断故障的能力。 在这种情况下, 控制系统的故障诊断也就应 运而生。控制系统的故障诊断理论从70年代产生到现在己经得到了迅速的发展。己经在航天、航空核反 应堆、热电厂、机器人以及众多的工业过程中得到了广泛的应用,并取得了巨大的经济效益。控制系统 的故障诊断问题具有广阔的前景,有着重大的理论和实用价值。 控制系统故障诊断技术是一门应用型的边缘学科,它的基础理论是现代控制论、计算机工程、数理 统计、信号处理、模式识别、人工智能、人工神经网络以及相应的应用学科。它的研究己经成为控制领 域中的前沿课题。 1-1-3 国内外研究水平和发展方向 控制系统故障诊断, 就是利用软件或硬件的方法对控制系统的运转进行监视, 实时检测出系统发生 的故障并对故障进行隔离。对是什么原因引起故障、故障的程度有多大等问题也需要进行相应的分析。 1971年美国麻省理工学院的Beard博士首先提出了用解析冗余代替硬件冗余,并通过系统自组织使 系统闭环稳定,通过比较器的输出得到系统故障信息的思想,标志着这门技术的开端。经过二十多年的 发展,控制系统的故障检测与诊断技术己经得到深入、广泛的研究、己经提出了许多可行的方法。70
1

过程控制系统执行器与传感器故障诊断研究

年代是控制系统故障诊断发展的初级阶段。 这一期间故障诊断理论还不太成熟, 理论的应用实例也很少。 一些简单的故障算法诸如检测滤波器(1971)、 广义似然比(1974)、 极大似然比(1979)等都是在这一阶段 提出的。 80年代是控制系统故障诊断技术蓬勃发展的一个阶段。 在这期间有15种新的理论方法被提出, 理论 的实际应用也得到了发展。不过,这一阶段的故障诊断技术应用面比较狭窄,主要集中在航天、船舶、 发电厂、核电厂等一些专门领域,普通的工业控制领域涉及并不多。使用的故障诊断方法主要是基于观 测器/滤波器方案或是系统辨识和参数估计方案。 进入90年代以后,人们对于控制系统故障诊断理论的研究更加深入,各种方法己经不再完全孤立, 而且随着其理论的发展相互渗透和融合。 另外理论应用的领域也有了很大的扩展。 虽然参数估计和观测 器/滤波器方案仍然是使用得最多的故障诊断方法,但近年来使用神经网络、模糊逻辑及组合方法的故 障诊断在明显的增加。对于非线性系统的故障诊断也有了更多的研究。 我国对控制系统故障诊断的研究起始于80年代初,基本上一直是处于跟踪学习国外理论的水平上, 自己独特的见解很少。实际的故障诊断装置更是凤毛麟角。从作者收集的资料来看,国内对于这一领域 的研究是进入90年代以后才真正活跃起来, 与国外研究水平相比我们还有很大的差距。 控制系统故障诊 断技术从发展至今已经涌现出了大量的故障诊断算法,人们对这一领域的研究已经取得了丰硕的成果。 但总的来说,应用的水平还不太高,而且一个完善的理论体系还有待形成。目前,控制系统故障诊断的 研究工作需要解决的问题除了进一步发展和完善故障诊断理论外, 更重要的是如何将现有的理论成果成 功地应用于实践。 为了让故障诊断算法能应用于工程实际, 一个必须解决的问题是诊断算法的鲁棒性问题。 鲁棒性是 指设计出来的故障诊断系统在对故障具有很高敏感性的同时具有对噪声、干扰及建模误差的不敏感性。 80年代中期, 故障诊断的鲁棒性设计就已经成为一项活跃的研究课题。 事实上鲁棒性问题的解决是故障 诊断理论能否走向实际工程应用的关键。对于这一问题,不少学者都有过深入的研究。目前,鲁棒性问 题的研究己经成为故障诊断领域中的一个前沿课题。 故障诊断理论的发展是通过数学、建模、计算机仿真和实验取得的,另外它还和控制理论本身的发 展有着密切的关系。 实验研究对于故障诊断来说变得日益重要, 所以合理的进行计算机仿真对于故障诊 断技术的发展有着非常重要的意义。

§1-2 故障诊断的概念及种类
1-2-1 控制系统故障诊断的概念和任务 控制系统故障诊断, 就是利用软件或硬件的方法对控制系统的运转进行监视, 实时检测出系统发生 的故障并对故障进行隔离。对是什么原因引起故障、故障的程度有多大等问题也需要进行相应的分析。 故障是由于系统中部分元器件功能失效而导致整个系统功能恶化的事件。 当系统发生故障时, 系统中全 部或部分的参变量就表现出与正常状态不同的特性, 这种差异就包含着丰富的故障信息。 故障诊断的任 务是对系统故障的特征进行描述, 并利用这种描述去检测和隔离系统的故障。 故障诊断包括故障特征提 取、故障估价和故障决策等几个部分。 由于现代控制系统规模大、复杂性高,而且系统的投资巨大,人们迫切需要提高自动化系统的可靠 性、维修性和安全性。为了提高控制系统的可靠性,人们可以从多个方面着手,如:提高元部件的可靠 性或对系统进行容错设计等。但是,无论采用什么方法来提高系统的可靠性,系统最终还是会发生故障 的。 因此故障诊断技术成为提高控制系统可靠性的最后一道防线故障诊断子系统可以在线监控整个系统 的运行状态。当控制系统发生某些局部故障时,可以迅速报警,并隔离出发生故障的部位,以帮助维修 人员迅速查找出故障源进行排除,以防止故障的进一步扩散。另外,故障诊断子系统还可以构造一种新 的容错控制系统,即根据故障诊断信息,可得被控对象的结构和参数变动情况。在此基础上可以重构控 制律,以确保控制系统稳定。从目前的发展来看,控制系统故障诊断和容错控制有着密切的联系,故障
2

河北工业大学硕士学位论文

诊断是容错控制的基础,容错控制的发展为故障诊断研究带来了新的活力。 故障诊断的任务从低级到高级可分为四个方面的内容: 1.故障建模:按照先验信息和输入输出关系,建立系统故障的数学模型,作为故障检测与诊断的依据。 2.故障检测:从可测或不可测的估计变量中,判断运行的系统是否发生故障,一旦系统发生意外变化, 应发出报警。 3.故障的隔离与估计:如果系统发生了故障,给出故障源的位置,区别故障原因是执行器、传感器和被 控对象或是特大干扰。故障估计是在弄清故障性质的同时,计算故障的程度、大小及故障发生的时间等 参数。 4.故障的分类、评价与决策判断:故障的严重程度,以及故障对系统的影响和发展趋势,针对不同的工 况采取不同的措施,其中包括保护系统的启动,以防故障的传播,预防灾难性事故的发生。 1-2-2 故障诊断的种类 1. 依赖于模型的故障诊断方法 基于模型的故障诊断方法的指导思想是用解析冗余取代硬件冗余,然后通过构造观测器估计出系 统输出,再与系统输出的实际测量值作比较得到残差信号。残差信号中包含着丰富的故障信息,经过 故障方向辨识,可以从中隔离出故障的部位,从而达到故障诊断的目的。基于解析模型的方法是现有 FDD 方法研究中成果最多的一个,又可以分为两种:分别是基于状态估计的故障诊断方法和基于参数 估计的故障诊断方法。 ⑴ 基于状态估计的方法 一般认为,基于状态估计的方法起源于 1971 年Beard所作的一次报告中[2]。在报告中,Beard首先 提出了故障诊断检测滤波器的概念,这也标志着基于状态估计的故障诊断方法的诞生。随后有大量的 研究人员对这种FDD方法进行了探讨。 基于状态估计的方法首先要构造状态观测器对系统的状态进行估计, 用来得到系统输出的估计值。 然后用输出的估计值和实际测量值之间的偏差信号作为残差信号来判断系统中是否发生了故障。正常 情况下,系统的残差信号是很小或趋近于零的。当系统中发生了执行器、传感器或其他元部件的故障 时,系统的残差信号则会有一个较大的变化,这种变化显然包含系统的故障信息在内,只需对残差信 号进行故障方向辨识就可准确地定位出故障的位置。 Commault提出用一组观测器协作检测系统中发生 的故障[15]。这是更为有效、可靠的FDD方法,然而可能加大故障诊断的时间。 为了使故障诊断机构对未知输入(扰动信号)和系统的参数摄动具有鲁棒性,Saif应用未知输入 观测器(UIO)方法设计了故障诊断算法[16],并在线辨识受损部件的故障程度。随后,Chen 进一步研 究了基于未知输入观测器的故障诊断方法[17],并将其用于含有随机噪声的一类系统的故障检测中[18]。 用于观测一类含随机噪声系统状态的更有效的工具是Kalman滤波器,很自然地研究人员就将Kalman 滤波器用于随机系统的故障诊断。Caliskan将Kalman滤波器用于传感器的故障检测[19],Keller则仔细分 析了用于故障诊断的Kalman滤波器的结构,并对其残差进行了解耦,使得能够同时检测多个执行器故 障[20]。Larson[21]使用和Commault相同的思路,但使用不同的方式发展了一组受限的kalman滤波器,可 以对系统中发生的执行器或传感器故障进行检测和诊断。很有在实际应用中推广的价值。 基于状态估计的故障诊断方法依然是人们研究的一个热点。在故障诊断机构中,对故障信号检测 的敏感性和故障诊断机构对系统参数摄动的鲁棒性是始终存在着的矛盾体,如何协调二者之间的矛盾 以便能达到各自指标的最优化是人们都在努力解决的问题。实际应用中所面临的一些问题也有待于人 们去进一步探讨。 ⑵ 基于参数估计的方法 一个实际系统总是由多个元部件组成的,而每一个元件或部件的特性都可以通过一个物理参数来 描述,如电路中的电阻、电容、电感,机械弹簧的弹性系数等等,通常被称为物参。而由实际物理系 统抽象出来的数学模型中的系数,被称为模型参数,简称模参。模参描述系统的整体行为,而物参则 描述构成系统的元部件的局部行为,二者以一定的映射关系联系在一起。记物参为 P,模参为θ,则
3

过程控制系统执行器与传感器故障诊断研究

P 和θ的映射关系可以表示为θ=f(P),常被称为物参-模参关联方程。系统的故障总是由于系统中的 某一或某些元部件的损坏、失效或性能降低引起的,也就是说系统发生故障时,必定是某些元部件的 物参发生了变化。而物参的变化又必然引起相应的模参的变化。若已知模参θ的变化情况,就能通过 物参-模参关联方程确定出物参 P 的变化情况,从而可以进行故障诊断,这是基于参数估计的故障诊 断方法的主导思想。 对比基于状态估计和基于参数估计的两种故障诊断方法,可以看出: 基于状态估计的方法具有较好的实时性,因为不论是常规的观测器还是 Kalman 滤波器都是呈指 数型收敛的,这在实际应用中有很大的价值;而参数估计方法的收敛性要差一些,会导致比较大的故 障诊断的延时。基于状态估计的方法对系统的输入信号的要求不是很严格,并不需要有连续不间断的 激励信号存在。而基于参数估计的方法却总是需要有激励信号存在,这一点也限制了基于参数估计的 方法在实际中的应用。基于状态估计的方法能够检测出来的故障是有限的,特别是被控对象的故障情 况,即便是能检测出来,也很难准确定位出被控对象中受损元件的物理位置和受损程度。这是基于状 态估计方法的缺陷,却恰恰是基于参数估计方法很容易解决的问题。这两种故障检测方法如能结合起 来使用,将会产生更大的效用。 2. 不依赖于模型的故障诊断方法 当前的控制系统变得越来越复杂,不少情况下要想获得系统的数学模型是非常困难的。不依赖于 模型的故障诊断方法因此受到了人们的高度重视。而基于知识的方法不需要精确的数学模型,也因此 具有很好的发展前景[23]24]。 ⑴ 基于信号的方法 ① 基于直接可测信号的故障诊断方法 这种方法根据直接可测的输入、输出信号和它们的变化趋势来进行故障诊断。在正常情况下,输 入、输出信号的变化范围和变化趋势总是在一定的范围之内,当超出规定的范围时,就说明系统中有 故障发生。 ② 基于信号处理技术的故障诊断方法 借用信号处理手段,对系统的输出在频率、幅值、相位和相关性等方面进行分析以获取系统中的 故障信息。常用的有谱分析方法、相关分析方法等[23,24,25]。其中,小波变换是一种比较新的基于信号 处理技术的故障诊断方法[23,25],是一种时间—尺度分析方法,具有多分辨率分析的特点。利用连续小 波变换可以检测信号的奇异性。因为噪声的小波变换的模极大值随着尺度的增大迅速衰减,而信号的 小波变换的模极大值随尺度增大而增大(或由于噪声的影响而缓慢衰减) ,即噪声Lipschitz指数处处都 远小于零,而信号在突变点的Lipschitz指数大于零(或由于噪声的影响而等于模很小的负数) ,所以, 可以用连续小波变换区分信号突变和噪声。同样,离散小波变换可以检测随机信号频率结构的突变。 主要有两种基于小波变换的故障诊断方法:一种是利用观测器信号的奇异性进行故障诊断;另一种是 利用观测信号频率结构的变化进行故障诊断。 小波变换不需要系统的数学模型, 对噪声的抑制能力强, 有较高的灵敏度,运算量也不大,是一种很有前途的方法。 ⑵ 基于知识的方法 目前,基于知识的方法不需要精确的数学模型,是人们研究的一个热点问题。主要包括基于神经 网络的方法、基于模糊逻辑的方法和各种智能控制的结合方法。 ① 基于神经网络的方法 由于神经网络具有处理非线性和自学习以及并行运算的能力,使其在非线性系统的故障诊断方面 有很大的优势。神经网络技术代表了一种新的方法体系,它以分布的方式存储信息,利用网络的拓扑 结构和权值分布实现非线性映射, 并利用全局并行处理实现从输入空间到输出空间的非线性信息交换。 对于特定问题建立适当的神经网络故障系统,可以从其输入数据(代表故障症状)直接推出输出数据 (代表故障原因) ,从而实现故障检测与诊断。 ② 基于模糊逻辑的方法 这种方法应用模糊逻辑对故障输出的残差进行处理,而后给出诊断结果。
4

河北工业大学硕士学位论文

具体有以下几方面的应用。 1) 残差的模糊逻辑评价 这种方法首先需要将残差用模糊集合来表述,然后用模糊规则“If…then…”进行推理,最后通过 反模糊化得到诊断结果。 2) 采用模糊逻辑自适应调节阈值 残差的阈值易受建模不确定性、扰动及噪声的影响。阈值过小会引起误报,过大则会漏报,所以 最好是能根据工作条件,自适应的改变阈值的大小,降低误报率和漏报率。在难以得到精确的数学模 型时,可以用模糊规则描述自适应阈值。 ③ 基于定性模型的方法 1) 定性仿真 定性仿真是定性推理的一种方法,它把系统行为描述为状态转换图,系统可能的行为则是状态转 换图中的一条途径。系统的定性模型由一组表示物理参数的定性变量(具有有限定量值,并为时间的 函数)和一组表示各参数间相互关系的定性方程构成。定性仿真则是描述并模仿系统的结构,从给定 的初始状态出发得到当前系统状态。相应的故障诊断策略分为两类:一类是基于故障模型的,另一类 是基于正常模型的。前者用故障模型来解释当前观测结果,它需要了解所有故障模式,后者不需要了 解故障模式,它是根据当前观测结果是否符合所有可能的预测状态来检测故障的。 2) 知识观测器 在基于知识的系统中,知识观测器类似于解析模型中的状态观测器和卡尔曼滤波器,它由四部分 组成:i) 定性模型,用来预测系统的行为,它主要是用定性仿真或符号有向图进行推理;ii) 差异检测 器,用来检测实际症状与预测症状之间的差异,可以用隶属度函数表示;iii) 侯选者产生器,根据差 异提出可能的故障源,一般用有限搜索法进行搜索;iv) 诊断策略,用来协调整个循环搜索过程,确 定与实际过程的症状相匹配的模型。快速而高效的故障诊断算法一直是人们设计的目标,把智能算法 用于故障诊断中并推广到实际应用中去,是人们研究的兴趣所在。 1-2-3 故障检测和诊断技术中存在的问题及其发展趋势 基于观测器故障诊断方法的突出问题是未知输入(干扰、未建模动态等未知干扰因素)与故障、 故障与故障之间的可分离问题。 前一问题本质上是故障诊断的鲁棒性问题,所谓鲁棒性是指故障检测诊断系统对模型误差及其他 不确定干扰的抗拒能力。对它的处理途径有两种: (1) 设计时忽略不确定因素,将设计好的观测器置于存在不确定因素的条件下进行检验、评估, 如果不能满足性能要求,再对设计加以修改完善。 (2) 设计时全面考虑不确定因素的影响,对系统进行优化,是系统对不确定因素呈现出鲁棒性。 故障诊断的鲁棒性常常与故障诊断系统对故障的敏感性要求相矛盾,要求折衷考虑。对未知输入干扰 因素的鲁棒性从某种意义上来说是决定基于观测器故障诊断方法成败的关键, 成为 80 年代中后期、 90 年代初期基于观测器故障诊断理论研究的热点和重点。Patton 和 Kangethe(1989 年)用观测器特征结 构配置的方法实现对未知输入解耦,但缺少实用有效的特征结构配置求解方法;Frank(1989 年)提 出了未知输入感测器的概念;Ge 和 Fang 也提出了一种鲁棒观测器设计的方法。这些方法的求解大都 较复杂,寻求一种可用计算机迭代求解的鲁棒观测器设计方法成为人们追求的目标。 基于参数估计故障诊断方法存在的问题有: (1) 基于参数估计的故障诊断方法利用模参—物参关联方程反推物理元件参数,而对于一个实际 系统,模参—物参关联方程的个数不一定等于物参的个数,且这种模参—物参关联方程是非线性的, 由此求解物理元件参数是困难的,甚至是不可能的。 (2) 当系统发生故障时,不仅可能引起模型参数的变化,而且还可能引起模型参数的变化。基于 参数估计的动态故障诊断所面临的是一种变结构参数系统参数估计问题,需要一种同时辨识模型结构 和参数的实时递推算法。
5

过程控制系统执行器与传感器故障诊断研究

(3) 系统故障发生的时刻,系统故障引起系统模型结构和参数变化的形式(是突变还是漂移变化, 是参数变化还是结构变化,或者两者兼而有之)是不确定的,而对不确定时变、变结构、变参数辨识 问题,目前的辨识方法难以胜任。如何解决这三个问题成为基于参数估计故障诊断方法能否成功应用 的关键。 知识库的建立本身就是一个费时而困难的工作,有些经验是领域专家的直觉,难以形式化描述, 而且当系统规模较大时,存在着冲突消解和组合爆炸等问题,推理的效率比较低。专家系统处理问题 的能力至多是知识库中知识的总和。目前专家系统还缺少有效的自学习和自适应机制,一种有效的尝 试是把专家系统和人工神经网络相结合,把人工神经网络的学习机制引入到专家系统;另一种发展趋 势是基于模型的方法与基于经验的方法相结合,相互取长补短。 故障树分析法可以对系统或机器的故障进行预测和诊断,分析系统的薄弱环节,实现系统的最优 化。用故障树分析法不仅可以考虑系统中硬件和软件的故障,还可以考虑人的因素,不仅可以分析由 单一故障引发的系统故障,还可以分析两个以上构件同时发生时才会发生的系统故障。其缺点是由于 所列举的系统故障的种类不同,有可能漏掉重大的部件或元件故障。另外,故障树分析法的理论性较 强,逻辑性严密,当分析人员本身的经验和知识水平不一时,所得结论的置信度也会有所不同。 模式识别方法的困难在于如何表述系统故障的特征向量和确定合适的判别函数;模糊数学的方法 的困难在于建立模糊关系矩阵和如何确定某一故障属于某一故障的隶属度,即如何确定故障的模糊隶 属度向量,而这些都依赖于对系统的认识和有关系统的先验知识。从系统的运行数据中提取这些信息 的方法可能是下一步的发展方向。 基于人工神经网络的故障诊断方法具有从样本中进行学习、归纳、推广的能力,是一种有前途的 方法。但如何确定合适的网络结构和规模、算法的收敛性、快速性、实时性,以及如何保证学习样本 的完整性和代表性是有待进一步研究的问题。

§1-3 本文研究的内容
论文总结了近年来传感器与执行器故障诊断领域的最新研究成果,对两大类基本的诊断方法进行 了深入研究。首先分析过程控制系统中执行器与传感器的故障类型并对其建立数学模型。在 simulink 环境下仿真出故障,利用基于数学模型的方法对故障进行诊断,应用观测器原理实现了控制系统传感 器与执行器故障的诊断。 由于控制系统中故障类型与故障征兆之间的关联关系不是线形关系,建立精确的数学模型非常困 难。本文采用基于神经网络的方法,根据故障信息,设计智能程序解决复杂的故障诊断问题。利用神 经网络模型使神经网络的输入节点对应故障征兆,输出节点对应故障原因进行模式分类。先用一批故 障样本对模型进行训练,网络训练好后,故障的模式分类就是根据给定的一组征兆,实现征兆到故障 之间非线性映射的过程。基于神经网络控制系统的故障诊断分为两部分:一是故障样本数据及检验数 据的采集;二是故障诊断。在故障样本数据及检验数据的采集过程中,首先建立了控制系统的数学模 型,人为地让控制系统发生各种故障,从而采集到各种故障数据,经过归一化处理后,作为训练神经 网络的样本数据;同时,也采集检验数据,用以检验训练出的神经网络是否能够起到故障诊断的作用。 本文针对 BP 神经网络易陷于局部极小值和运算速度慢和遗传算法易出现未成熟收敛的缺点, 研究 了将两者结合起来的 GA-BP 算法, 该算法既具有 BP 算法的较强的局部搜索能力和非线性映射能力, 又 有遗传算法的强的全局搜索能力。并建立了用于过程控制故障智能诊断的遗传一神经网络模型。该模 型继承了传统遗传算法的优点,兼具神经网络强大的函数逼近功能,同时又克服了传统神经网络优化 方法易陷入局部最优解的缺陷。实例的训练和模式识别结果表明:实数编码的遗传算法优化的神经网 络模型模式识别精度较高,适合于过程控制系统的故障诊断。

6

河北工业大学硕士学位论文

第二章 过程控制系统故障的建模
§2-1 控制系统模型的建立
在设计一个故障诊断子系统时, 首先要考虑的就是被监控的系统可能会发生什么样的故障。 只有了 解系统可能发生的故障类型, 才能有针对性的设计故障诊断算法, 使得设计出的故障诊断子系统对这类 算法具有最大的敏感性,这样才能达到故障的检测与隔离的目的。 一个过程控制系统,它的基本结构如图2.1所示,由控制器、执行器、被控对象和传感器等部分组 成。

图2.1 控制系统结构简图 Fig 2.1 Structure fig of control system 控制系统的故障可理解为导致系统出现不期望行为的任何异常现象。 按照故障出现的位置来划分可 以分为四类,传感器故障、执行器故障、被控对象故障(系统故障)及控制器故障。 传感器故障和执行器故障是控制系统中最常见的故障, 也是导致控制系统失效的主要原因。 据统计, 80%的控制系统失效都是由传感器和执行器故障造成的。因此,研究传感器和执行器的故障诊断具有重 大的理论和应用价值。 被控对象故障多见于飞行控制系统, 包括飞机被击受伤、 航天器来自内部外部的突击等。 文献[5][6] 讨论的故障诊断就是针对被控对象故障的。 控制器,目前由计算机来实现,而计算机软硬件的可靠性己经达到了较高的水平。所以在对控制系 统进行故障诊断时,一般不再考虑控制器的故障,即认为控制器是正常的。当然,对于可能有的控制器 故障,我们可以通过采用容错计算机、多重冗余及系统自检等方法来加以解决。 故障的另外一种划分方法是按照故障的性质来划分。按照故障性质来划分时可分为:渐变性故障、 突变性故障和完全失效故障。 渐变性故障是指特性发生较慢的变化、参数漂移,这类故障,对控制系统的损害一般只有在超过一 定限度时,才作故障处理,否则可由鲁棒控制、自适应控制等方法加以解。渐变性故障的检测相对来说 比较困难,但我们必须对它加以重视。对于某些系统如发电、大型化工设备等,渐变性故障可能是导致 灾难性故障的征兆,所以对其进行检测和隔离是十分必要的。 突变性故障是指特性发生阶跃的变化,对线性传感器和执行器而言,指恒增益跳变或恒偏差跳变; 对被控对象而言,指某些参数的阶跃式变化,或导致结构性的变化。突变性故障对控制系统性能会产生 极大的影响,是容错控制研究的主要问题。对于突变性故障,在未发生结构性变化的情况下,可采用探 明其大小后予以补偿的容错措施, 或者采用鲁棒控制器的办法利用系统的参数自由度和结构冗余度, 使 系统的某些性能对某些部件或某一类故障不灵敏。 完全失效故障是指突变性故障的极限情况。如传感器卡死、执行器卡死等。这类故障将导致控制系 统出现灾难性的后果。 对于完全失效故障, 一般采用诊断后重构控制器的方法予以解决.在一定条件下, 也可采用鲁棒控制的方法。 在采集样本数据之前,必须建立控制系统的数学模型,系统结构图如图2.1所示。
7

过程控制系统执行器与传感器故障诊断研究

2-1-1 控制器数学模型 这里采用 PID 控制器,其离散表达式为:

u (n) = KPe(n) + KI ∑ e(i ) + KD[e( n) ? e(n ? 1)]
i =1

n

(2-1-1)

由递推原理得:

u (n ? 1) = KPe(n ? 1) + KI ∑ e(i ) + KD[e(n ? 1) ? e(n ? 2)]
i =1

n

(2-1-2)

两式相减得:

△u ( n) = Ae( n ) ? Be( n ? 1) + Ce( n ? 2)

(2-1-3)

在上式中:

T TD + ) TI T TD B = KP (1 + 2 ) T TD C = KP T A = KP (1 +

其中, T 为采样周期, K P 为比例系数, TI 为积分时间常数, TD 为微分时间常数, e 为偏差。 2-1-2 执行器模型 执行器数学模型为: 将其离散化为:

dy + y = K 1u1 dt y ( n) ? y (n ? 1) T1 + y (n) + K 1u1( n) T T1

(2-1-4)

整理得:

y1(n) =

T1 /T K1 y1(n ? 1) + u1(n) (T 1 / T + 1) (T 1 / T + 1)

y1( n) = Hy1( n ? 1) + Iu1( n)

式中

T1 /T (T 1 / T + 1) K2 I= (T 2 / T + 1) H=

其中, T 为采样周期, T 1 为时间常数, u1 为 PID 控制器的输出 2-1-4 传感器模型 传感器数学模型为: T 3 将其离散化为:

dy + y = K 3u 3 dt y (n) ? y (n ? 1) T3 + y (n) = K 3u 3(n) T

(2-1-5)

整理得:
8

y1(n) =

T3/T K3 y 3(n ? 1) + u 3( n ) (T 3 / T + 1) (T 3 / T + 1)

河北工业大学硕士学位论文

y 3( n) = Hy 3( n ? 1) + Iu 3( n)

式中

T3/T (T 3 / T + 1) K3 I= (T 3 / T + 1) H=

其中, T 为采样周期, T 3 为时间常数, u 3 为 PID 控制器的输出

§2-2 控制系统故障的数学表示
考虑线性、定常的控制系统

dx(t ) = Ax(t ) + Bu (t ) dt y (t ) = Cx(t )
n p

(2-2-1)

式中:x (t ) 为状态矢量,x(t ) ∈ R ;u (t ) 为控制矢量,u (t ) ∈ R ; y (t ) 为观测矢量, y (t ) ∈ R ;
m

A, B, C 为相应维数的常数矩阵。
常见的传感器或执行器故障行为有卡死、恒增益变化、恒偏差三种,下面分别描述其故障发生时 的模型。 2-2-1 执行器故障模型 1.执行器卡死 第 i 个执行器卡死的故障模式可以描述为:

uiout (t ) = ai
实际控制系统中执行器的输出有一个限制范围,即

ai 为常数

u min out ≤ uout (t ) ≤ u max out
若超出这个范围,则执行器的输出值不在变化,有

u min out ≤ a ≤ u max out
2.执行器恒增益变化 执行器恒增益变化的故障模式可以描述为:

uout (t ) = auout (t )
式中, a 为恒增益变化的比例系数。 3.执行器恒偏差失效 执行器恒偏差变化的故障模式可以描述为:

uout (t ) = uout (t ) +△i

△i 为常数

上述执行器的三种故障行为,将影响系统的动态行为,对于式(2-2-1) ,执行器的三种故障行为 可以表示为:

9

过程控制系统执行器与传感器故障诊断研究

dx(t ) = Ax(t ) + Bu (t ) + fin(t ) dt
y (t ) = Cx (t )
式中, fi 被定义为执行器的故障矢量, f i ∈ R 故障, n(t ) 将以不同的函数形式给出。
p

(2-2-2)

(2-2-3) ; n(t ) 表示为该故障的函数,对于上述三种执行器

2-2-1 传感器故障模型 1.传感器卡死:令 yiout 是第 i 个传感器的实际输出, yiin 为第 i 个传感器正常时应该输出的信号则 第 i 个传感器卡死的故障模式为:

yiout (t ) = ai
式中, a i 为常数, i =1,2,3…m。 2.传感器恒增益变化:第 i 个传感器恒增益变化的故障模式为:

yiout (t ) = β iyiin (t )
式中, β i 为增益变化的比例系数。 3.传感器恒偏差失效:第 i 个传感器恒增益变化的故障模式为:

yiout (t ) = yiin (t ) +△i
式中,△i 为常数。 上述传感器三种故障行为, 将造成控制器的误控制作用, 误控制作用将改变被控对象的动态方程, 所以,对于动态式(2-3-1) ,传感器故障的一般表示为:

dx(t ) = Ax (t ) + Bu (t ) dt y (t ) = Cx(t ) + fsζ (t )
对于上述三种类型故障,ζ (t ) 式中, fs 为传感器故障矢量, fs ∈ R ;ζ (t ) 为表示该故障的函数。
m

将以不同的形式给出。

§2-3 本章小结
本章主要介绍了控制系统中常见的故障类型,并详细介绍了采用状态空间形式对控制系统中传感 器故障和执行器故障进行描述的方法,最后给出了一般控制系统受到可能故障影响下的状态空间描述 形式。

10

河北工业大学硕士学位论文

第三章 基于数学模型的故障诊断研究

§3-1 运用状态观测器进行诊断的背景和意义
迄今为止的控制理论都是基于传感器和执行器工作正常的假设,因此系统的可靠性依赖于相应传 感器和执行器的可靠性,一旦传感器或执行器发生故障,如果得不到及时处理,轻则影响生产和产品 质量,重则可能造成事故的发生。执行器是自动控制系统信息输入装置中的敏感元件,其工作状态直 接影响到系统的状态。但由于执行器工作环境复杂、恶劣、分布广、数量大、安装部位特殊等原因, 使得执行器成为过程控制中的薄弱环节之一,是系统中最容易发生故障的部件,仅靠人力去发现和修 复执行器故障很难做到及时有效。 为了提高控制系统的可靠性,维修性和安全性,需要建立一个监控系统来监督整个控制系统的运 行状态,不断监测系统的变化和故障信息。进而采取必要的措施,防止系统灾难性事故的发生,而其 前提是监控系统必须具有在线监测和诊断故障的能力。 故障诊断技术的应用发展迅速,在控制系统故障诊断理论中,首先发展起来的是基于状态观测器 的故障诊断方法。在现场应用中运算模块数量和运算周期的时间存在着限制,状态观测器阶次和数量 越小,组态实现越容易,运算效率也越高。因此,研究如何利用一个状态观测器实现执行器故障诊断 具有重要的意义。

§3-2 基于数学模型的故障诊断原理
3-2-1 状态观测器的故障诊断设计原理 基于观测器的故障诊断方法的基本思想是:设计系统的观测器(即检测滤波器) ,然后根据滤波器 的输出与实际系统的输出比较,产生残差,再对残差进行分析、处理,以实现故障诊断。下面给出其 具体设计原理。 控制系统及其检测滤波器结构如图 3.1,图中所示的控制系统可以表示为:

x(t ) = Ax (t ) + Bu (t ) y (t ) = Cx(t )
式中 x (t ) 是 n × 1 维的状态变量, u (t ) 是 r × 1 维控制矢量, y (t ) 为 m×1 维的测量矢量, A, B, C 为相 应维数的常数矩阵。检测滤波器包含一个正常工作条件下的系统动态模型。模型的输入与真实系统的 输入相同。系统传感器输出与模型输出之间的差值信号经增益矩阵 H 反馈到模型输入。 通过选择增益矩阵 H ,使矩阵 ( A ? HC ) 的特征值具有负实数部分。若滤波器是稳定的,则在正 常工作条件下,滤波器任何初始误差都会渐渐消除,滤波器将准确地跟踪系统的响应,输出误差 △(t ) 将保持为零。当系统中某一传感器或执行器发生故障时,滤波器的模型将不能正确地反映发生故障后 的系统特性,输出误差将不为零,对输出误差进行观测就可以确定是否有发生故障。

11

过程控制系统执行器与传感器故障诊断研究

图 3.1 控制系统与检测滤波器 Fig 3.1 Control system and detection filter 图 3.1 中的故障检测滤波器可以表示为:

? ? ? x(t ) = Ax (t ) + Bu (t ) + H [ y (t ) ? y (t )] ? ? y (t ) = Cx (t )
定义:状态误差(残差)

? e (t ) = x (t ) ? x ( t )
测量误差

? △(t ) = y (t ) ? y (t )
则状态误差方程

? ? ? e(t ) = x(t ) ? x(t ) = Ax(t ) + Bu (t ) ? Ax(t ) ? Bu (t ) ? H [ y (t ) ? y (t )] = ( A ? HC )e(t )
输出误差方程

? △(t ) = y (t ) ? y (t ) = Ce(t )
下面分别考虑执行器和传感器故障时的诊断问题。 (1) 执行器故障 在前一章已得到结论,假设第 j 个执行器发生故障,则故障数学模型可以表示为

u (t ) = ud (t ) + erjn(t )
式中, ud (t ) 为正常状态下,期望的控制输入; erj 为在第 j 个坐标上的单位 r 维矢量,则
?0 ? ?...? ?0 ? ?1 ? ? ? ?0 ? ?...? ?0 ? ? ?

erj =

矩阵中的 1 表示第 j 个元素, n(t ) 为任意的标量时间函数。 此时状态方程为:

12

河北工业大学硕士学位论文

x(t ) = Ax(t ) + Bu (t ) = Ax(t ) + B[ud (t ) + erjn(t )] = Ax (t ) + Bud (t ) + bjn(t )
式中, bj 为矩阵 B 的第 j 列矢量,可以叫做事件矢量。 此时,状态误差方程和输出误差方程分别为

e(t ) = ( A ? HC )e(t ) + bjn(t )
△(t ) = Ce(t )
(2)传感器故障 假设第

j 个传感器发生故障,则其故障数学模型可表示为
y (t ) = Cx (t ) + emjn(t )

式中, emj 为在第 j 个坐标方向上的单位 m×1 维矢量,对应第 j 个传感器故障
?0? ?...? ?0? ?1 ? ? ? ?0? ?...? ?0? ? ?

emj =

矩阵中的 1 表示第 j 个元素, n(t ) 为任意的标量时间函数。 此时,状态误差方程为

? ? ? e(t ) = x(t ) ? x(t ) = Ax(t ) + Bu (t ) ? [ Ax(t ) + Bu (t )] ? H [ y (t ) ? y (t )] = ( A ? HC )e(t ) ? Hemjn(t ) = ( A ? HC )e(t ) ? hjn(t )
式中, hj 为矩阵 H 的第 j 列矢量。 此时,输出误差方程为

? ? △(t ) = y (t ) ? y (t ) = Cx(t ) + emjn(t ) ? Cx(t ) Ce(t ) + emjn(t )
综合执行器故障与传感器故障,它们的状态误差方程与输出误差方程相同,可以写为

e(t ) = ( A ? HC )e(t ) + fn(t )

△(t ) = Ce(t )
式中, f 为事件矢量(或故障矢量) 。 3-2-2 状态观测器的设计要求 状态反馈控制需要用到系统的状态向量。由于状态作为系统内部变量,实际现场不能全部直接量 测,需要采用状态观测器进行状态重构。状态重构的实质是,对给定确定性线性时不变被观测系统Σ, 构造与Σ具有相同属性的一个系统即线性时不变系统Σo,用Σ中可直接量测的输出 y 和输入 u 作为

? Σo 的输入。并使Σo 状态 x 或其变换在某种指标下等价于Σ的状态 x 。等价指标的要求通常取为渐 进等价,即
? lim x (t ) = lim x (t )
t →∞ t →∞

? 并且,称状态 x 为被观测系统Σ状态 x 的重构状态,所构造系统为被观测系统Σ的状态观测器。

13

过程控制系统执行器与传感器故障诊断研究

3-2-3 极点位置选取的一般原则 在反馈系统动态矩阵的特征值的选择上,并没有唯一的和普遍最优的法则。因为系统本身情况是 复杂多变的,而且对控制系统的性能和鲁棒性的要求也是相互制约、矛盾的。所以不可能对所有的系 统和所有的设计要求都有一个单一的和普遍最优的极点选择法则。 极点的位置越靠左 (负实部的绝对 值越大) ,则所在系统达到稳态响应(或零输入响应衰减)的速度就越快。 2. 根轨迹的角度,如果反馈控制系统的极点离开环传递函数的极点(一般主要是受控系统的极点 所组成)越远,则配置这些反馈系统的极点所需要的反馈控制的增益也越大,而反馈控制的增益越大, 一些反馈系统(如极点数目多于零点数目两个以上的和有不稳定零点的系统)的极点趋向不稳定的可 能性也越大,而且受执行机构的线性区域限制,实际在现场中,是达不到这种理想的控制效果的。另 外,执行机构动作过于频繁,也会对设备产生不良影响。所以极点配置并不是把被控对象的极点配置 得离虚轴越远越好。 3. 重复特征值所对应的特征向量往往是广义特征向量, 而广义特征向量会使对应的特征值对于所 在矩阵的参数变化有很大的敏感性,并使系统的暂态响应不平稳,因此应该尽量避免重复特征值。 4. 在单变量控制系统的一些最佳性能指标中,都要求控制系统的极点有相近的绝对值并均匀分 布。这一点和第 3 条是关于极点相对位置的理解。 总之,特征值的选择不是简单容易的,需要经过试验,这也许是对实际情况更客观的反映,也是 对控制工作者的挑战,特征值的选择还应该比较注意实际控制的效果和限制[27]。

§3-3 仿真研究
3-3-1 建立系统模型 过程控制试验双容水槽控制系统如图 3.2 所示:

图 3.2 双容水槽控制系统 Fig 3.2 The second-order object of flux control system 该系统有两个串联在一起的水槽,它们之间的连通管具有阻力,两者之间的水位是不同的。水流 首先进入水槽 1,然后再通过水槽 2 流出。水流入量 Qi 有调节阀控制,流出量 Qo 由用户根据需要改 变, Q1 为水槽 1 流出量,被调量是水槽 2 的液位 H 2 。 H 1 为水槽 1 的液位, F 1 , F 2 分别为两水槽的 截面积, R1 , R 2 分别为线性化水阻。 1)对系统机理建模
14

河北工业大学硕士学位论文

根据物料平衡得: 水槽 1 水槽 2

dH 1 1 = (Qi ? Q1) dt F1 dH 2 1 = (Q1 ? Qo) dt F2

(3-3-1) (3-3-2) (3-3-3) (3-3-4) (3-3-5)

其中: Qi = K μμ

Q1 =

1 H1 R1 1 Qo = H2 R2

各量均以其稳态值为起点算起。 由以上各式并整理后得:

T 1T 2
其中

d 2H 2 dH 2 + (T 1 + T 2) + H 2 = K μ R1 2 dt dt
R1R 2 R1 + R 2

(3-3-6)

T 1 = F 1R1、T 2 = F 2

(3-3-7)

此式为一个二阶微分方程,是对被控对象中含有两个串联水槽的反映。 拉氏变换得:

G ( s)
其中 K = K μ R1 2)利用阶跃扰动法求模型参数

H 2( s ) K = 2 μ ( s ) T 1T 2 s + (T 1 + T 2) s + 1

(3-3-8)

当对象处于稳态时,在它的输入端给一个阶跃△μ ,根据对象的输出 Y 得到阶跃响应曲线,然后 辨识出对象数学模型的传递函数表示。根据阶跃响应曲线得到对象数学模型的传递函数的方法有近似 法、图解法及两点法等。 静态放大系数 K 由所测阶跃响应曲线估计并绘出被控量的最大稳态值 y (∞ ) ,得到放大系数

K = [ y (∞ ) ? y (0)] /△μ
二阶对象的阶跃响应曲线,其传递函数可表示为 G ( s ) =

K ,其中 T 1 ≤ T 2 。式中 (T 1s + 1)(T 2 s + 1)

的 K、T 1 T 2 需要从阶跃响应曲线上求出, 在阶跃响应曲线上取 y (t )t1 = 0.4 y (∞ ) 时曲线上的点 y1 和 、 相应的时间 t1 。 y (t )t 2 = 0.8 y (∞ ) 时曲线上的点 y 2 和相应的时间 t 2 。然后,利用下面的近似公式计算

T 1、T 2 ,放大系数 K 可用上面的方法求得。 t1 + t 2 其中, T1 + T 2 ≈ 2.16
T 1T 2 t1 ≈ (1.74 ? 0.55) 2 (T 1 + T 2) t2
15

过程控制系统执行器与传感器故障诊断研究

对于 G ( s ) =

K t1 t1 表示的二阶系统,0.32 < < 0.46 。 当 = 0.32 时, 为一阶对象。 (T 1s + 1)(T 2 s + 2) t2 t2



K t1 。 = 0.46 时,对象的传递函数为 G ( s ) = (Ts + 1) 2 t2

3)近似二阶对象传递函数的建立 我们把电动执行器、上水槽、下水槽和液位变送器看作一个广义的被控对象。当液位变送器的变 送信号处于稳态时,在电动调节阀一端给一个阶跃扰动,然后把液位变送器的数据采集到计算机中, 绘出阶跃响应曲线。根据曲线特征获取模型阶次的信息以及模型的特征参数,建立广义被控对象的数 学模型。 1)近似为二阶惯性环节 在上面,通过机理分析的方法,得出了双容水槽为一个二阶惯性环节,传递函数为

G ( s) =

K Kv ,电动调节阀也可以认为是一个一阶惯性环节传递函数为 Wv ( s ) = , (T 1s + 1)(T 2 s +1) Tvs + 1

液位变送器可以认为是一个比例环节传递函数为 Wm ( s ) = Km 。那么广义被控对象的传递函数为

Wp ( s ) =

KKvKm 。由于电动调节阀的时间常数 Tv 远小于双容水槽的时间常数,这就 (T 1s + 1)(T 2 s + 1)(Tvs + 1)

意味着广义被控对象的动态特性主要由双容水槽这个二阶惯性环节来决定,那么可以把它近似为一个 二阶惯性环节 Wp ( s ) =

Kp 。 (T 1s + 1)(T 2 s +1)

2) 阶跃信号的选择 阶跃信号的目的是让系统把它的动态特性表现出来, 依据本系统的实际, 选择了 0.5V 的阶跃信号。 3)稳态工作点的选择 在大多数工业现场,阶跃信号一般是在稳态工作点时加入的,这样建立起来的便是在稳态工作点 时的数学模型。也就是说,找到一个最感兴趣的稳态工作点,然后在这个稳态工作点,来辨识出对象 的数学模型。在次实验中,我们选择了电动调节阀电压为 2v,系统达到稳态时,作为稳态工作点。 4)实验过程 实验过程如下,给调节阀 2V 电压,当压力变送器的信号稳定后,再给调节阀一个 2.5V 的电压, 产生一个 0.5V 的阶跃信号。 下面根据试验数据计算各个参数:

Kp =

y (∞) ? y (0) 3.05 ? 1.53 = = 3.04 0.5 △u

在 试 验 记 录 中 找 到 y (t )t1 = 0.4 y (∞ ), y (t )t 2 = 0.8 y (∞ ) 所 对 应 的 数 据 y1、y 2、t1、t 2 。 得 到

t1 = 984、t 2 = 2244、t1 / t 2 = 0.4385 。然后根据下式计算 T 1、T 2 。 t1 + t 2 T1 + T 2 ≈ 2.16
T 1T 2 t1 ≈ (1.74 ? 0.55) 2 (T 1 + T 2) t2
16

河北工业大学硕士学位论文

解得: T 1 ≈ 460, T 2 ≈ 1034 ,得出由电动调节阀、上水槽、下水槽和液位变送器组成的广义被控 对象传递函数为: Wp ( s ) =

3.05 (460s + 1)(1034 s + 1)
1 。 0.02 s + 1

考虑到电动调节阀是一个时间常数较小的一阶惯性环节, 假设其传递函数为 GV ( s ) =

3-3-2 观测器设计 二阶水位控制系统传递函数方框图如图 3.3 所示:

图 3.3 过程控制系统传递函数 Fig3.3 Process control system transfer function 被控对象状态空间方程为:

x(t ) = Ax(t ) + Bu (t ) y (t ) = Cx(t )
由传递函数可以求得系数 A, B, C :

?-32.8599 -13.5314 ? A=? ? ? 46.0097 12.8599 ?
观测器极点特征值配置到:[-20+3*i,-15-10*i]。 PID 控制器的参数经调试选为:

?1 ? B=? ? ?0?

?7 ? C=? ? ?2?

T

Kp = 1.2 Ki = 1 Kd = 0.8 设计状态观测器时,通过选择增益矩阵 H ,使矩阵 ( A ? HC ) 的特征值具有负实数部分,保证观测
器是稳定的。由于设计观测器的问题等价于求[52] H ,使矩阵 ( A ? C H ) 的特征值具有事先给定的
T T T T

(在左半平面的)极点。由参考文献[52]计算状态观测器反馈增益参数 H 方法为: 1) 设 C = [c1 , c 2 … cr ] ,构造矩阵
T T T T

R = [c1T AT c1T … AT u1?1 c1T ;… cr ? 1T AT cr ? 1T … AT ur ? 1?1 cr ? 1T ; cr T AT cr T … AT ur ?1cr T ]

第 u1 列


第 u1 + … ur ? 1 列
17

过程控制系统执行器与传感器故障诊断研究

W = [0 … 0e 2;… ; 0 … 0er; 0 … 0] ?1 T ? 式中 ei 是 r 阶单位矩阵的第 i 列,计算 H = (WR ) 。 T T ?T 2) 计算 A = A + C G 和其特征多项式

sI ? AT = s n + an ? 1s n ?1 + … + a1s + a 0 3) 对观测器的给定的 n 个极点 λ 1, λ 2, … λ n ,计算要求的特征多项式

( s ? λ 1)( s ? λ 2) … ( s ? λ n ) = s n + an ? 1s n ?1 + … + a1s + a 0 g T = [? a 0, ? a1, … ? an ? 1] 并计算 T ?1 ?T 4) 计算 g = g T ,式中
?q ? ? T ? qA ? T ?1 = ? ? ? ? n ?1 ? ? qA ? ? ?
q 是 ( AT , cT 1) 的能控性矩阵的逆矩阵的最后一行 (c1, AT ) 的能观测性矩阵的最后一列的转置。 ? ? 5) H = G + [ g , 0] 即为所求
由以上步骤得出所求矩阵 H 为:

H = [4.2657 -6.4300]'
3-3-3 故障诊断仿真 由以上参数在 simulink 下得出仿真图形为:

图 3.4 执行器恒偏差变化时系统输出的变化 Fig3.4 The system output of actuator persist warp

图 3.5 执行器恒偏差变化时 观测器的输出 Fig3.5 The observer output of actuator persist warp

由图 3.4,3.5 可以看出在执行器发生恒偏差变化时,系统在短时间内有波动,经过波动后系统又达到 新的稳态。在故障发生的瞬间观测器输出会有很大变化,随后输出又重新回到原来状态。

18

河北工业大学硕士学位论文

图 3.6 执行器恒增益变化时系统输出的变化图 Fig3.6 The system output of actuator persist plus 设定值,在观测器的输出上反映出误差逐渐增大。

图 3.7 执行器恒增益变化时观测器的输出 Fig3.7 The observer output of actuator persist plus

图 3.6,3.7 是对执行器恒增益变化进行的仿真。如图所示,当出现此故障时被控对象输出值不能跟随

图 3.8 执行器卡死变化时系统输出的变化图 Fig3.8 The system output of actuator locked 逐渐变大

图 3.9 执行器卡死变化时观测器的输出 Fig3.9 The observer output of actuator locked

由图 3.8,3.9 可以看出在执行器卡死时,观测器的输出不能保持为定值,随着时间的推移,输出误差 由以上仿真可以看出,利用观测器对过程控制系统中的执行器进行故障诊断能够达到识别故障的 效果,但是此方法需要建立其数学模型,对于大型系统运算比较复杂。

19

过程控制系统执行器与传感器故障诊断研究

§3-4 本章小结
本章首先介绍了基于状态观测器故障诊断的原理,分析了其数学表达形式。利用过程控制试验平 台进行二阶水槽液位控制试验,根据采集到的数据辨识出系统模型,在该模型基础上进行了状态观测 器的设计,使它满足状态重构和故障诊断的需要,根据控制系统的特点,设计了 PID 控制器。同时用 基于模型的故障诊断方法进行了执行器三种典型故障模型的诊断,仿真表明这种设计能够实现执行器 故障诊断的功能,简化了系统设计。但是此方法只能确定故障时间与类型,不能确定故障来自传感器 还是执行器。在下一章利用神经网络可以对故障进行分类。

20

河北工业大学硕士学位论文

第四章 神经网络在故障诊断中的应用
神经网络技术是目前一个十分引人注目的研究领域,其理论研究正在不断的深入,应用神经网络 技术来解决各种类型的实际问题得到了广泛的重视。本章将介绍神经网络的基本原理,以及它在故障 诊断中的应用。神经网络技术地出现,为故障诊断问题提供了一种新的解决途径,特别是对复杂系统。 由于基于解析模型的故障诊断方法面临着难以建立系统模型的实际困难,基于人工智能的故障诊断方 法成了重要的、也是实际可行的方法。神经网络的I/O非线性映射特性、信息的分布存储、并行处理和 全局集体作用,特别是其高度的自组织和自学习能力,使其成为故障诊断的一种有效方法和手段,并 己在许多实际系统中得到了成功的应用。由于神经网络具有的非线性大规模并行处理方面的特点,以 [2-5] 及容错性及学习能力 ,可避免分析冗余技术中实时建模的需要,因而可被应用于控制系统执行器和 传感器故障诊断。

§4-1 神经网络简介
人工神经网络结构和工作机理基本上是以人脑的组织结构(大脑神经元网络)和活动规律为背景, 它 反映了人脑的某些基本特征,但并不是要对人脑部分的真实再现,可以说它是某种抽象、简化或模仿。 参照生物神经元网络发展起来的人工神经元网络现己经有许多种类型, 但他们中的基本单元一神经元的 结构是基本相同的。 大脑神经网络系统之所以具有思维认识等高级功能, 是由于它是由无数个神经元相互连接而构成的 一个极为庞大而复杂的神经网络系统。人工神经网络也是一样,单个神经元的功能很有限的,只有用许 多神经元按一定规则连接构成的神经元网络才具有强大的功能。 4-1-1 人工神经网络连接的基本形式 人工神经元的模型确定以后,一个神经网络的特性及能力主要取决于网络的拓扑结构及学习方法。 下面介绍人工神经网络连接的几种基本形式: (1)前向网络; (2)反馈网络; (3)层内互连前向网络; (4)互联网络; 4-1-2 人工神经网络的学习方法类型 神经网络的学习问题归根结底就是网络连接权的调整问题。神经网络连接权的确定一般有两种方 式: 一种是通过设计计算确定, 即所谓的死记式学习; 另一种是网络按一定规则通过学习(训练)得到的。 大多数神经网络使用后一种方法确定其网络的权值。 神经网络的学习(训练)方法归纳起来有如下几种类型: 从学习过程的组织与管理而言有:有监督学习和无监督学习。 从学习过程的推理和决策方式而言有:确定性学习(大多数学习方法属于此类)、随机学习和模糊学习。 4-1-3 人工神经网络的工作过程 当神经网络构成和训练好了之后,它就可以正常进行工作,可以用它来分析数据和处理问题。神经 元网络的工作过程有许多种形式,这里主要介绍两种最常用的形式。 第一种,回想。当神经元网络通过学习训练存储到了一定的信息之后,就可以采用回想的方式来识
21

过程控制系统执行器与传感器故障诊断研究

别新输入的信息。这相当于网络对原先存储的信息的恢复和译码。 假设网络通过学习存储了一系列的记忆模式的集合, 当网络输入某一信息时, 它可能类似于存储的 模式集合中的若干个模式,这时可以联想最接近的存储模式,称为自动联想。通过输入模式也可以联想 出变换的模式,称为异联想。异联想过程是在存储模式对中的联想。 第二种,分类。神经网络计算的另一种形式,输入模式被分成若干类,可看成是从存储的集合中找 出对输入模式的响应, 也可看成是输入模式的分类程度的联想。 分类也可理解成异联想的一种特殊情况。 网络中典型的分类是通过离散值输出矢量。 如果网络希望响应是一个分类数, 但输入模式并不能确 切真实地对应着集合中的那种模式,但可以贴近那一种,这种处理叫识别。例如,对语音、图像等信息 [33] 的识别。神经元网络处理信息的能力有:分类、联想、识别、归纳概括 。

§4-2 多层网络的误差逆传播校正方法
误差逆传播算法用英文可写为Error Back-Propagation Training,主要意思是从后向前计算,所 以人们把采用这种算法进行误差校正的多层前馈网络称为BP网。 4-2-1 误差逆传播校正方法 误差逆传播校正方法是利用实际输出与期望输出之差对网络的各层连接权由后向前逐层进行校正 的一种计算方法。理论上讲,这种方法可以适用于任意多层的网络,为简单起见,下面以图4.1这样一 个三层网络模型为例介绍一下误差逆传播学习规则的原理。

图4.1 三层神经网络 Fig4.1 Three layers neural network 假设网络的输入层有 n 个神经元,输出层有 如下: 输入模式向量 期望输出向量 中间层各单元输入激活值向量 中间层各单元输出向量 输出层各单元输入激活值向量 输出实际值向量 输入层至中间层的连接权
22

p 个神经元,中间层有 q 个神经元。由于中间层与输

入、输出端没有直接的联系,所以也常把中间层称为隐含层。为计算方便,我们首先把网络的变量设置

Xk = [ x1k , x 2 k ,… , xn k ] ; Tk = [t1k , t 2 k ,…, tn k ] ; Sk = [ s1k , s 2 k , …, sp k ] ; Bk = [b1k , b 2 k ,… , bp k ] ; Lk = [l 1k , l 2 k ,… , lq k ] ; Yk = [ y1k , y 2 k ,…, yq k ] ;

Wij ;

河北工业大学硕士学位论文

中间层至输出层的连接权 中间层各单元的阀值 输出层各单元的阀值 其中

Vjt ;

θ j; γ t;
j = 1, 2, … , p; t = 1, 2, … , q; k = 1, 2, … , m;

i = 1, 2, … , n;

激活函数采用S型函数

f ( x) =

1 1 + e? x

在这里使用Delta学习规则即利用误差的负梯度来调整连接权, 使其输出误差单调减少。 经过推导可求 [32] 得连接权 Wij 的调节量为 :

△Wij = ? β
其中

?Ek = β ? ej k ? xj k ?Wjt
et k = (tt k ? yt k ) f '(lt k )
(t = 1, 2, … q )
k

0 < β <1

设 et k 为 Ek 对输出层输入 lt k 的负偏导: 输出层阀值的调整量为:△rt = adt k

中间层阀值的调整量为:△θ = β ? ej ( j = 1, 2 … , p ) 网络的全局误差为:

E = ∑ Ek = ∑∑ (tt k ? yt k ) / 2
k =1 k =1 t =1

m

m

q

从以上可以看出,各连接权的调整是分别与各个学习模式对的误差函数 Ek 成正比例变化的,这种 方法称为标准误差逆传播方法。而相对于全局误差函数 E 的连接权的调整,应该在所有 m 个模式全部 提供给网络后统一进行,这种算法称为累计误差逆传播算法。当学习模式集合太大时,即学习模式对较 少时,累计逆传播算法比较标准误差逆传播算法收敛速度要快。 4-2-2 BP 网络的学习与计算方法 上一节求得的对各个连接权和阀值进行校正的数学表达式,可构成即网络的学习规则。 如图4.1所示,一般来讲,BP网是一种具有三层或三层以上的多层神经元网络,它的左、右各层之 间各个神经元实现全连接, 即左层的每一个神经元与右层的每个神经元都有连接, BP网络按有教师学习 方式进行训练。 当一对学习模式提供给网络后, 其神经元的激活值将从输入层经各中间层向输出层传播, 在输出层的各神经元输出对应于输入模式的网络响应。然后,按减少希望输出与实际输出误差的原则, 从输出层经各中间层、最后回到输入层逐层修正各连接权。由于BP网络有处于中间位置的隐含层,并由 相应的学习规则可循, 可训练这种网络, 使其具有对非线性模式的识别能力。 特别是它的数学意义明确、 步骤分明的学习算法,更使其具有广泛的应用前景。 BP网的学习过程主要由四部分组成: (1)输入模式顺传播(输入模式由输入层经中间层向输出层传播计算); (2)输出误差逆传播(输出的误差由输出层经中间层传向输入层); (3)循环记忆训练(模式顺传播与误差逆传播的计算过程反复交替循环进行); (4)学习结果判别(判定全局误差是否趋向极小值)。 下面分别介绍和分析这四个过程: (1)输入模式顺传播 这一过程主要是利用输入模式求出它所对应的实际输出。
23

过程控制系统执行器与传感器故障诊断研究

设输入模式向量为

Xk = [ x1k , x 2 k ,… , xn k ] Tk = [t1k , t 2 k , …, tq k ]

( k = 1, 2, … m ; m 一学习模式对数; n 一输入层单元个数) 与输入模式相对应的希望输出为 ( q 一输出层单元数) 根据BP神经元模型原理[4],计算中间层各神经元的激活值

Sj = ∑ Wij i xi ? θ j ( j = 1, 2,… , p )
n t =1

式中 Wij 输入层至中间层的连接权; θ j 一 中间层单元的阀值;

p 一 中间层单元数。
激活函数采用S型函数,即

f ( x) =

1 1 + exp(? x)

这里之所以选S型函数作为BP网神经元的激活函数是因为它是连续可微分的,而且更接近于生物神 经元的信号输出形式。将上面的激活值带入激活函数中可得中间层

j 单元的输出值为

bj = f ( sj ) =

1 1 + exp(?∑ Wij ? xi + θ j )
i =1 n

( j = 1, 2, …, p)

阀值 θ j 在学习过程中和权值一样也不断地被修正。阀值的作用反映在 S 函数的输出曲线上,相当于将 输出值移了 θ 个单位。 同理,可求得输出端的激活值和输出值,设输出层第 t 个单元的激活值为 lt ,则

lt = ∑ Vjt ?bj ? γ t
j =1

p

设输出层第 t 个单元的实际输出值为 y ,则 yt = f (lt ) 式中 Vji 一中间层至输出层连接权; γ 一 输出层单元阀值;

(t = 1, 2, … q )

f - S 型激活函数。
利用以上各式就可计算出一个输入模式的顺传播过程。 (2) 输出误差逆传播 当这些实际的输出值与期望的输出值 在第一步的模式顺传播计算中我们得到了网络的实际输出值, 其误差大于所限定的数值时, 就要对网络进行校正。 计算时是从输出层到中间层, 再从中间层到输入层。 输出层的校正误差为: 式中 tt k 一 期望输出;

dt k = (tt k ? yt k ) ? f ' (lt k )

t = (1, 2, … , m)

yt k 一 实际输出; f ' (lt k ) 一 对输出层函数的导数。
这里采用的实际上是一种delta中间层各单元的校正误差为:
24

河北工业大学硕士学位论文

ej k = (∑ Vjt ? dj k ) f ' ( sj k )
t =1

q

式中: ( j = (1, 2, … , p
k k

k = 1, 2, … , m)

在这里,每一个中间层单元的校正误差都是由 q 个输出层单元校正误差传递而产生的。当校正误差 求得后,则可利用 dj 和 ej 延逆方向逐层调整输出层至中间层,中间层至输入层的连接权。 对于输出层至中间层连接权和输出层阀值的校正量为:

△Vjt = adt k bj k △γ = adt k
式中, bj 一 中间层 j 单元的输出;
k

dt k 一 输出层的校正误差。 ( j = (1, 2, … , p t = 1, 2, … , q k = 1, 2, … , m)

0 < a <1

中间层至输入层的校正量为:

△Wij = β ? ej k ? aj k △θ = β ? ej k
式中, ej 一中间层 j 单元的校正误差
k

i = 1, 2, … , n

0 < β < 1 (学习系数)。

(3)循环记忆训练 为使网络的输出误差趋于极小值。 对于BP网输入的每一组训练模式, 一般要经过数百次甚至上万次 的循环记忆训练,才能使网络记住这一模式。 这种循环记忆训练实际上就是反复重复上面介绍的输入模式顺传播和输出误差逆传播过程。 (4)学习结果的判别 当每次循环记忆训练结束后, 都要进行学习结果的判别。 判别的目的主要是检查输出误差是否己经 小到允许的程度。如果小到了允许的程度,就可以结束整个学习过程,否则还要进行循环训练。训练的 过程是网络全局误差趋向极小值的过程。 根据上面的分析,可以得到BP网络的整个学习过程的具体步骤: (1)初始化给各连接权 Wij 、 Vjt 及阀值 θ j , γ t 赋予[-1,+1]之间的随机值。 (2)随机选取一模式对 Xk = [ x1 , x 2 , … xn ] , T = [t 1 , t 2 , … tq ] 提供给网络。
k k k k k k

(3)用输入模式 Xk = [ x1 , x 2 ,… xn ] ,连接权 Wij 和阀值 θ j 计算中间层各神经元的输入 s (激活
k k k

值),然后用 sj 通过激活函数

f ( x) =
(4)计算中间层各单元的输出 bj :

1 1 + e? x

bj = f ( s j )
式中, sj = ∑ Wij i xi ?θ j
n

(5)用中间层的输出 bj 、连接权 Vjt 和阀值 γ t 计算输出层各单元的输入激活值 lt ,然后用 lt 通过激活 函数计算输出层各单元的响应 yt , yt = f (lt ) ,式中

i =1

25

过程控制系统执行器与传感器故障诊断研究

lt = ∑Vjtbj ? γ t
j =1

p

其中 (t = 1, 2,… , q ) (6)用希望输出模式

T = [t1k , t 2 k ,… tn k ] ,网络实际输出 yt ,计算输出层各单元的校正误差 dt k : dt k = (tt k ? yt ) ? yt ? (1 ? yt ) (t = 1, 2,… , q ) k (7)用 Vjt , dt , bj 计算中间层的校正误差 ej : ej k = [∑ dt ? Vjt ] ? bj ? (1 ? bj )
t =1 q

( j = 1, 2,… , p )

用 dt k , bj , Vjt ,和 γ t ,计算下一次的中间层和输出层之间的新连接权:

Vjt ( N + 1) = Vjt ( N ) + a ? dt k ? bj

γ t ( N + 1) = γ t ( N ) + a ? dt k
式中 N 一学习次数。 (8)由 et k , ai k , Wij 和 θ j 计算下一次的输入层和中间层之间的新连接权:

Wij ( N + 1) = Wij ( N ) + β ? et k ? ai k

θ j ( N + 1) = θ j ( N ) + β ? et k
(9)随机选取下一个学习模式对提供给网络,返回到第三步,直至全部 m 个模式对训练完。 (10)重新从 m 个学习模式对中随机选取一个模式对,返回到第三步,直至网络全局误差函数 E 小 于预先设定的限制值(网络收敛)或学习循环次数大于预先设定的数值。 在以上的步骤中,(3)一(5)为输入模式的“顺传播过程”,(6)一(8)为网络误差的“逆传播过程”, (9)一(10)则完成训练和收敛过程。 4-2-3 BP 网络的缺陷 虽然BP网络得到广泛的应用, 但它也存在自身的限制与不足, 其主要表现在它的训练过程的不确定 上,具体说明如下: (1)要较长的训练时间 对于一些复杂的问题, BP算法可能要进行几小时甚至更长时间的训练。 这主要是由于学习速率太小 所造成的,可采用变化的学习速率来加以改进。 (2)具有很大的冗余性 网络隐含层的层数及隐含层的单元数的选取尚无理论上的指导,而是根据经验确定。因此,网络往 往有很大的冗余性,无形中也增加了网络学习的时间。 (3)存在局部极小点问题 在学习过程中, 当学习反复进行到一定次数后, 虽然网络的实际输出与希望输出还存在很大的误差, 但无论再如何学习下去,网络全局误差的减少速度都变得很缓慢,或者根本不再变化,这种现象是因网 络收敛于局部极小点所致。 BP网络的全局误差函数E是一个以S型函数为自变量的非线性函数。 这就意味 着由E构成的连接权空间不是只有一个极小点的曲面,而是存在多个局部极小点的超曲面。导致这一缺 陷的主要原因是采用了按误差函数梯度下降的方向进行校正。 4-2-4 各种参数的选取及对训练神经网络产生的影响 如果初始权值选取不当, 使激励函数处于饱和状态或使误差函数落入静态区域, 将使收敛过程当缓 慢。因此权值应在(-1,1)间随机选取,以次保证每个神经元节点在开始训练时都在使其激励函数变化
26

河北工业大学硕士学位论文

最大处。从故障诊断结果来看,初始权值对系统性能的影响较小。 学习率的初始值的神经网络的训练也有一定的影响。学习率取值小,可以避免计算过程中的振荡, 但使收敛速度变慢。学习率取值大,可加大搜索步长,但又容易引起搜索过程的振荡。 从理论上讲,可以任意选取隐含层的数目,隐含层的增加虽然能减少各隐含层的节点数目,但却增 加了算法落入局部极小的可能性, 因此其收敛速度不一定快。 先后有人证明了一个三层的BP网络可以实 现任意 n 维空间到 m 维空间的映射,因此在实际应用中选取三层BP网络。 4-2-5 故障诊断的神经网络方法 从以上特点可以看出,神经网络是一种与常规方法完全不同的信息处理技术。它能从大量的数据中 找出所包含的信息, 不会因为信息不清晰而使系统受阻, 这一特性使得它在故障诊断中不会因为原始数 据和信息的粗糙而降低系统诊断性能。神经网络是并行分布式处理系统,采用数据驱动的方法,知识获 取来源于样本示例的学习, 这种学习并不是死记数据, 而是从中提取对象所包括的一些基本特征和规律。 神经网络的这种自学习能力, 使得它非常适合于解决故障诊断中的先验知识难于获取的问题。 从结构上 来说,神经网络是一种多个神经元以一定方式连接而成的非线性系统,它具有的容错特性,能够识别带 有噪声和变形的输入信息,这对于处理工作环境变化大,故障复杂,有噪声干扰的故障诊断问题有利。 同时,由于神经网络从整体上看是并行处理,速度快,响应时间短,在一定程度上能满足实时诊断的要 求。 目前,国外在故障诊断领域的神经网络应用已经很多,神经网络理论已经比较成熟。国内虽然开展 比较晚,但也已进行了大量的研究,并在旋转机械等方面己有了成功的应用。神经网络在故障诊断中主 要应用于两个方面[13,14]。 1)神经网络时间序列故障预测 作为诊断对象模型的模拟器故障诊断的前序工作是对系统进行监控,因此在对系统进行诊断推理 时, 首先需要对其正常行为和状态有所认识方可准确的判断出问题的发生及问题的所在。 神经网络的另 一重要作用就是可对系统模型进行模拟, 神经网络具有良好的的函数拟和功能, 在给出一定的训练样本 的前提下, 通过自学习自动建立系统的模型。 其一般形式为利用诊断对象在正常状态下的输入输出数据 对人工神经网络进行训练,建立系统正常状态下的模型。工作时,只需给定一定的输入数据,训练好的 网络模型即可产生相应的输出,比较模型在正常状态下的输出,即可判断出当前系统的工作状态。严格 来说这种神经网络是一种工况识别器,并不是故障诊断器,一般需要后续处理,但它比较适合对系统进 行实时监控,能及时判断系统的工作正常或异常。 2)神经网络作为故障模式分类器 这方面的应用主要实现故障模式的分离,确定系统的故障类别。模拟过程是通过一组训练样本,样 本的输入为对象的症状特征向量,输出为诊断结果,对输入输出之间的关系进行自学习。训练好的神经 网络可以直接用于故障诊断,症状与故障之间的关系存储在网络的权值中。诊断时,输入系统症状信息 向量,相应的网络输出会显示系统的具体故障,这也是我们通常意义上的诊断过程。

27

过程控制系统执行器与传感器故障诊断研究

§4-3 基于神经网络时间序列预测器的故障诊断
4-3-1 神经网络的时间序列预测方法简介 在经济、工程、自然科学和社会科学等领域的实际工作者和研究人员都要和一系列的观察数据打 交道,我们把按时间顺序产生和排列的观察数据序列称为时间序列。如果数据序列是连续的,称为连 续时间序列;如果数据序列是离散的,则称为离散时间序列。 时间序列预测是对数据进行预处理,通过统计分析决定统计意义下的最佳时序模型。它主要有两 个缺点:一是模型的选择需要某些假设;二是以此法建立的模型一般难以有效地处理非线性或多维非 线性相关的复杂时间序列。面对自然和社会经济现象中大量存在的非线性、非平稳的复杂动力系统问 题,传统的统计学预测方法解决这类问题效果欠佳。 基于神经网络的时间序列预测的基本思想是利用网络的非线性映射能力逼近时间序列中隐含的 关系,由网络的输入(历史数据)计算相应的输出(预测数据)。神经网络时间序列预测的基本过程如下: (1)将时间序列分为训练数据和检验数据两部分; (2)应用训练数据对神经网络进行训练,应用检验数据验证网络性能,确定网络参数; (3)应用经过训练的网络对时间序列进行预测。 在时间序列预测中,前馈网络是最常使用的网络。在这种情形下,从数学角度看,网络成为输入 输出的非线性函数。记一个时间序列为 { xn} ,进行其预测可用下式描述:

xn + k = f ( xn , xn ? 1, … , xn ? m + 1)
时间序列预测方法即是用神经网络来拟合函数 f (?) ,然后预测未来值。 4-3-2 神经网络预测器的原理

(4-3-1)

神经网络已在许多领域得到了应用,其中之一是可用其进行时间序列预测,且采取神经网络进行序 列预测不需事先对序列的特征做假设,适用于平稳和非平稳信号。本文将神经网络应用于传感器输出序 列的预测过程中,因此需首先离线建立神经网络预测器模型。 用神经网络建立传感器输出序列预测模型的方法是:假设已经观测到的传感器输出样本为

? x(1), x(2),… x ( n) ,我们用其中的 m 个传感器输出观测值,预测 n + 1 时刻的传感器输出值 x( n + 1) ,利
用多层感知器进行学习和预测的具体步骤是:
(1) 首先把 x (1), x (2),… x ( n) 分成 k 组,每组有 m + 1 个值,前 m 个值作为神经网输入节点的输入,最后

一个值作为神经网络输出的期望值。 (2) 利用BP算法或其它算法将神经网络的连接强度进行训练。
(3) 利用收敛后的神经网络连接强度,将 x ( n ? m + 1), x ( n ? m + 2),… x ( n) 作为神经网络的输入,神经

? 网络的输出就是预测值 x ( n + 1) 。
传感器输出序列的神经网络预测模型建立后,应检验所建立的预测模型是否有效。模型的有效性可 通过检验其对传感器的预测输出和传感器实际输出之残差的相关性来确定。 4-3-3 BP 网络的预测模型 单步预测模型: 若一记 Xt = ( x1, x 2, ? ? ?, xN ) 是对某一研究对象一段时间的观测值,则对该时间序列可以用下述模
28

河北工业大学硕士学位论文

型来描述:

xt = h ( xt ? 1, xt ? 2, ? ? ?, xt ? N ) (4-3-2) 其中, h(i) 表示光滑函数, N 为该模型的阶次。 ? 对该时间序列进行预测就是利用该研究对象在 t 时刻以前的 N 个观测值来预测 t 时刻的值 xt : ' ? (4-3-3) xt = h ( xt ? 1, xt ? 2, ? ? ?, xt ? N ) ' ? (4-3-4) 其中, h (?) 是式(4-3-2)中 h 的近似。预测误差 ε 为: ε = xt ? xt

任何时间序列都可以看作是一个由非线性机制确定的输入输出系统,时间序列的建模是一个非线 性参数拟合过程。因而采用神经网络方法来实现非线性时间序列的建模与预测在理论上是可行的。 因此式(4-3-3)中的 h (?) 可以近似用一个三层 BP 网络来表示, 4.2 所示为基于 BP 网络的预测模 图
'

型,将完成式(4-3-3)的预测任务,它实质上可以看成是从输入到输出的高度非线性映射。

图 4.2 基于 BP 神经网络的预测模型 Fig 4.2 The forecasting model based on BP neural network 4-3-4 多步预测模型 上述模型只能实现时间序列变量的单步预测,虽预测精度高,单预测时步短。在对传感器或执行 器故障进行预测时,常希望能预测未来某一段时间内的故障发展情况。为此,采用时间滚动技术,实

? 现变量的多步预测,即当得到下一时步的预测值 xt 后,以其为当前已知数据反馈到输入层并删除其中 ? 最早的一个值以预测 xt + 1 ,依此类推,得到未来任意多步的预测值。下面具体讨论一下基于 BP 网络 的多步预测建模过程。 设有一个单变量时间序列 x1, x 2, x 3, … xk 现在欲采用这段时间序列对网络进行训练, 并对其后续时 间序列 xk + 1, xk + 2, xk + 3, … xn 分别进行预测。
当希望借助于 BP 网络每次输入任意 N 个连续时间序列值来预测其下一时刻的时间序列值时,网 络实质上起到模拟系统模型的作用,此时网络的训练样本个数为 K ? N ,即训练后网络的输入与输出 关系应该满足下列 K ? N 个非线性方程组成的非线性方程组:

? xN + 1 = h '( x1, x 2, x3, … , xN , W , b) ? xN + 2 = h '( x 2, x 3, x 4, … , xN + 1, W , b) ? ? ...... ? ? xK = h '( xK ? N , xK ? N + 1, … , xK ? 1, W , b) ?
其中 ( x1, x 2, x 3, … , xN ) ,( x 2, x 3, x 4, … , xN 其样本数 Q = K ? N ;
+1

(4-3-4)

) ,?????? ,( xK ? N , xK ? N + 1, … xK ? 1) 分别为网络的训练样本,

xN + 1, xN + 2, … , xK 分别为相应与各输入样本的目标输出;用于作为网络的训练输

入样本和目标输出的时间序列统称为训练样本。W , b 分别表示网络内所有的连接权和阀值,是网络训
29

过程控制系统执行器与传感器故障诊断研究

练中所要估计的参数。 当 网 络 训 练 收 敛 后 , 即 得 到 一 组 满 足 式 ( 4-3-4 ) 中 各 式 的 W , b 的 估 计 值 , 此 时 , 输 入

? ( xK ? N + 1, xK ? N + 2 , … , xK ) ,网络即可预测出其后续一个时刻的时间序列值 xK + 1 。同理,如果输入 ? ? ( xK ? N + 2 , xK ? N + 3, … , xK + 1) , 则 网 络 同 样 可 以 预 测 出 输 入 的 后 续 时 间 序 列 值 xK + 2 , … , 输 入
? ( xK ? N , xn ? N + 1, … , xn ? 1) 可以对 xn 进行预测。
4-3-5 基于神经网络预测器的传感器故障诊断原理 离线建立传感器输出信号的神经网络预测器模型后,实际在线应用时,可以用传感器实际输出的前m

? 步样本 x ( n ? m + 1), x (n ? m + 2), … x ( n) 预测传感器第 n + 1 步输出 x ( n + 1) ,传感器第 n + 1 步实际输 ? 反之传感器 出 x ( n + 1) 和预测输出 x ( n + 1) 之差如果超过一定的判断阈值,则可判断此传感器发生故障,
是正常的,如图4.4所示。阀值的选择应考虑传感器输出的噪声水平,即稍大于传感器的噪声方差,以 减少由噪声引起的误报警。

图 4.4 基于神经网络时间序列预测器的故障诊断示意图 Fig 4.4 The fault diagnosis fig based on NN time serial predictor 采用本方法进行诊断类似与第三章的基于观测器的故障诊断,其优点在于不需建立系统数学模型,利 用一系列时间数据就可以对系统进行重构。利用训练好的网络可以监控系统动态,但是不能对故障进 行具体分类。

§4-4 神经网络在执行器传感器故障分类中的运用
4-4-1 神经网络用于故障诊断的结构 通常,建立人工神经网络诊断模型要经过如下过程: 1)研究诊断对象的故障特征,根据具体情况和有关知识抽象、概括、归类系统故障与故障模式的样 本集合。 2)选择适当的人工神经网络模型并确定其参数结构。 3)根据所选定的模型,选择相应的学习算法,使其对样本学习,并将输入与输出的关系存储记忆在
30

河北工业大学硕士学位论文

网络的权值上,完成学习过程。 采集系统运行状态信号,进行必要的预处理,提取运行状态的特征参数,按输入的形式归纳出征兆 向量,并输入到已建立的神经网络模型。神经网络以实际作用的故障征兆向量为输入进行运算、回忆、 输出相应的故障模式,从而完成故障诊断。 一个神经元网络用于故障诊断时,主要包括三层:①输入层,即从控制系统接受的各种故障信息及 现象。②中间层,是把从输入层得到的故障信息,经内部的学习和处理,转化为针对性的解决办法。中 间层含有隐节点,它通过权系数连接着输入层与输出层,当然中间层可以不是一层,根据不同的需要, 可以采用多层,也可以不要中间层,只是连法不同。③输出层,是针对输入的故障形式,经过调整权系 数后,得到处理故障的方法。当网络训练完毕,对于每一个新输入的状态信息,网络将迅速给出分类结 果,图4.5表示基于神经网络的故障分类诊断的一般流程图。

图4.5 神经网络故障分类诊断般流程图 Fig 4.5 The flow fig of neural network fault diagnosis assort 4-4-2 控制系统(诊断对象)故障仿真 在训练神经网络之前,需要采集训练神经网络所需要的样本数据,人为地让传感器和执行器发生 故障,这样就可以采集到控制系统发生故障时的数据,将这些数据经过归一化处理之后作为训练神经 网络所需要的样本数据,最终训练出满足要求的神经网络,达到故障诊断的目的。同时,也采集检验 数据,用以检验训练出的神经网络是否能够起到故障诊断的作用,将检验数据作为神经网络的输入, 经计算得到神经网络的输出,如果没有得出期望的结果,则要改变神经网络的结构或神经网络的参数 值,重新训练神经网络,直到达到检验要求为止。如图 4.6 所示,该图为第三章二阶液位控制系统方 框图,在 simulink 环境下对该系统的执行器与传感器进行故障仿真,仿真结果如图 4.7 所示:

图 4.6 二阶水位过程控制系统 Fig4.6 Second-order liquid place process control system

31

过程控制系统执行器与传感器故障诊断研究

图 4.7(a)系统无故障时各环节输出 Fig4.7(a) every tache’s output in gear 图4.7(b)传感器恒偏差故障 Fig4.7(b) The fault of sensor persist warp

图 4.7(c) 传感器卡死故障 Fig4.7(c) The fault of sensor block 图4.7(d)传感器恒增益故障 Fig4.7(d) The fault of sensor persist plus

图4.7(e).执行器恒偏差故障 Fig4.7(e) The fault of actor persist warp

图4.7(f).执行器恒增益故障 Fig4.7(f) The fault of actor persist plus

32

河北工业大学硕士学位论文

图4.7(g)执行器卡死故障 Fig4.7(g) The fault of sensor block 4-4-3 样本特征值提取 在上面的故障仿真中, 分别在t=5s,10s,20s,30s,40s,50s,60s时采集传感器和执行器的输出, 将采 集到的数据作为样本数据,以便训练神经网络。神经网络的输入层节点数为14,分别代表每个输入样本 中的14个特征量值,输出层节点数取为6,分别代表6种故障类型(即传感器卡死、传感器恒增益变化、 传感器恒偏差失效、执行器卡死、执行器恒增益变化、执行器恒偏差失效)。 表4-1为在t=5s,10s,20s,30s,40s,50s,60s时刻采集到的样本数据,做为训练网络的输入数据。 下表 为训练样本中的两组示例数据: 表4-1.采样数据 执行器 5s 10s 执行器 卡死 执行器 恒增益 执行器 恒偏差 传感器 卡死 10 15 10 15 20s 10 15 30s 10 15 40s 10 15 50s 60s 10 15 10 15 5s 10s 20s 传感器 30s 40s 50s 60s 3.12 9.18 10.51 10.51 10.51 10.51 10.51 4.2 10.2 11.3 12.03 12.03 12.03 12.03 6.86 9.78 9.99 14.82 14.98 14.99 14.99 9.87 11.35 12.65 19.63 19.63 19.63 19.63 9.71 9.82 9.95 10.21 10.05 10.01 10.01 10.11 10.22 10.32 11.31 11.60 11.61 11.61 0.1 0.2 0.1 0.2 0.1 0.2 0.1 0.2 0.1 0.2 0.1 0.2 0.1 0.2

0.11 0.11 0.11 0.23 0.23 0.23

0.13 0.14 0.71 1.50 0.24 0.25 0.84 1.92

8.20 11.25 12.41 12.32 12.58 12.59 12.59 9.21 12.16 15.31 15.11 15.16 15.18 15.13 47.52 107.15 226.58 349.22 166.58 591.31 702.71 47.08 104.16 225.63 330.17 452.67 559.61 672.14 8.20 11.23 12.35 4.23 -7.85 -20.54 -33.23 8.23 11.22 12.39 12.49 -28.54 -88.66 -151.25 8.27 11.54 6.64 6.28 6.24 6.25 6.25 8.25 11.21 3.13 2.56 2.51 2.50 2.50

传感器 恒增益

9.71 9.78 9.96 10.95 11.03 10.98 9.71 9.78 9.96 10.18 15.04 15.04

11.04 15.05

传感器 恒偏差

9.71 14.78 10.06 10.02 10.01 10.02 10.02 9.71 17.79 10.10 10.01 9.98 10.01 9.99

4-4-4 采样数据归一化处理 由于神经元激励函数的饱和特性,要求输入样本向量各分量的数量级不能太大,应在[-1,1]之间,
33

过程控制系统执行器与传感器故障诊断研究

神经元输出在[0,1]区间内,因而要对实际样本的输入、输出进行归一化处理。 将采集到的数据作归一化处理,最终得到表3-2所示的经过归一化处理之后的作为训练神经网络所 需要的样本数据。在归一化处理过程中,采用下面的方法进行处理: 输入样本 Xk ,设输入样本的上下限为: xi max 和 xi min 利用

x 'ik = 2 ?
进行归一化处理,结果如下

xik ? xi min ?1 xi max ? xi min

i = 1, 2,… , ni

x 'ik ∈ [?1,1]

X 1 =[
-0.3695 -0.7158 -0.8689 -0.9105 -0.8190 -0.6802 -0.5962 -0.1927 0.1370 0.7831 0.2177 0.2177 0.2177 0.2177 -1.0000 -1.0000 -1.0000 -1.0000 -0.8803 -0.7239 -0.6280 0.9516 0.2678 1.0000 1.0000 1.0000 1.0000 1.0000 -0.6166 -0.7704 -0.8662 -0.9099 -0.8184 -0.6796 -0.5959 1.0000 0.1393 0.6257 0.1436 0.1734 0.1745 0.1745 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -0.6585 -0.7885 -0.8921 -0.9257 -1.0000 -1.0000 -1.0000 0.9193 0.0893 0.5679 0.0273 0.5275 0.5275 0.5286 -0.6576 -0.7887 -0.9743 -0.9859 -0.8710 -0.7188 -0.6265 0.9193 1.0000 0.5904 0.0098 0.0067 0.0098 0.0077]’

X 2 =[
-0.5828 -0.8152 -0.9127 -0.9435 -0.7953 -0.9002 -0.8825 -0.3715 0.2371 1.0000 0.4144 0.3992 0.3983 0.3983 -1.0000 -1.0000 -1.0000 -1.0000 -0.9084 -0.9305 -0.9056 0.4069 0.3188 0.9001 1.0000 1.0000 1.0000 1.0000 -0.6587 -0.7919 -0.8914 -0.9302 -0.7658 -0.8917 -0.8755 1.0000 0.3243 0.8924 0.3736 0.3374 0.3311 0.3311 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -1.0000 -0.6587 -0.7922 -0.8919 -0.9765 -1.0000 -1.0000 -1.0000 1.0000 0.3188 0.8943 0.4742 0.4691 0.4614 0.4694 -0.6558 -0.7864 -0.9423 -0.9648 -0.8384 -0.9124 -0.8927 1.0000 1.0000 0.9135 0.3478 0.3320 0.3324 0.3324]

以上两组输入用来做为训练神经网络的输入,该神经网络为三层网络。输入层采用14节点,中间层 20节点,输出层6节点,其中期望输出为: T= [1 0 0 0 0 0; 0 1 0 0 0 0;
34

河北工业大学硕士学位论文

0 0 1 0 0 0; 0 0 0 1 0 0; 0 0 0 0 1 0; 0 0 0 0 0 1] 该六种输出分别对应:执行器卡死、执行器恒增益、执行器恒偏差、传感器卡死、传感器恒增益、 传感器恒偏差。

§4-5 仿真研究
4-5-1 实例仿真 在利用神经网络对控制系统故障进行诊断之前, 必须对神经网络进行训练(学习), 因为神经网络类 [38] 似于人的人脑,人脑的智力活动是由训练(学习)“习惯成自然”形成的 。通过训练神经网络,让神 经网络“记住”故障的特征。当进行故障诊断时,如果再次出现与神经网络记忆中的特征相近的数据, 神经网络就会识别出来,从而实现故障诊断。 在matlab6.5环境下,设置: 学习过程显示频率为100,最大训练步数为8000,误差指标0.02,学 习率为0.01。经过5次训练,平均训练时间为53.1201s,平均训练步数为3195步。 把 X 2 输入训练好的网络得到输出:Y= 0.9963 -0.0037 0.0000 -0.0004 -0.0006 -0.0008 -0.0053 0.9931 -0.0007 -0.0014 -0.0013 -0.0007 0.0021 0.0028 1.0001 0.0003 0.0005 0.0005 0.0005 0.0010 0.0017 0.0011 0.0001 1.0004 0.0018 0.0019 0.0000 0.0002 1.0001 0.0000 0.0000 0.0009 0.0004 0.0003 0.0002 0.9994 取另一传感器卡死数据输入网络得: Y4=-0.0004 -0.0014 0.0003 1.0004 0.0002 0.0003 4-5-2 BP 改进算法 在前向神经网络的BP算法中, 学习率的取值是非常关键的, 要选择适当的学习率参数的值不是一件 容易的事情,这是因为:(1)如果选择太小,收敛速度可能很慢,而选择太大,可能引起振荡甚至导致 训练发散;(2)训练开始时较合适的参数值不见得对后来的训练过程合适。试验表明最佳值往往随具体 问题的学习过程而变,又因初始权值的决定是随机的,更使其无法预测。 对每次权值的调整均采用固定不变的学习率, 是导致收敛速度慢的一个主要 因此在传统BP算法中, [47-49] 。为了解决这一问题,应在训练过程中自动调节。调节参数的原则是检查某特定加权的修改是 原因 否确实降低了误差函数。对于学习率,其调节方法是:先设一初始值,若一次迭代后误差函数E增大, 则将学习率乘以一个小于1的常数,并沿原方向重新计算下一个迭代点;若一次迭代后误差函数E减小, 则将学习率乘以大于1的常数。 以表4-1中的数据作为训练网络的数据, 采用共轭梯度法, 同时学习率自调整的方法训练神经网络。 网络结构与上面的网络相同。由图4.9可以看出,训练开始时误差曲线下降很快,学习率随着增加。当 到100步之后,误差增大,及时的降低了学习率,使误差增加减缓。当到达误差曲线的新的波峰时,增 加学习率,误差曲线再次下降,经过几次反复,使学习速度维持在一定水平上,在很大程度上起到了提 高学习收敛速度,减少学习时间的作用。

35

过程控制系统执行器与传感器故障诊断研究

图4.9 学习率与误差曲线变化图 Fig 4.9 The change plot of learn rate and sum-squared error

4-5-3 隐含层单元数的变化对训练神经网络的影响 从理论上讲,可以任意选取隐含层的数目,隐含层的增加虽然能减少各隐含层的节点数目,但却增 因此其收敛速度不一定快。 先后有人证明了一个三层的BP网络可以实 加了算法落入局部极小的可能性, [50,51] ,因此在实际应用中应尽可能选取三层BP网络。 现任意n维空间到m维空间的映射 网络隐含层节点数的选择是一个比较复杂的问题, 目前还没有很好的理论公式来确定。 隐含层节点 数太少,网络无法“记住”学习样本,迭代过程不易收敛:隐含层节点数太多,虽然网络能够“记住” 所有学习样本,但其推广能力较差。目前比较常见的经验公式有:

H = 2N +1 H = N + M + a 1 < a < 10 0.02 N < H < 4 N
其中 H 为隐含层节点数, N 为输入层节点数, M 为输出层节点数。 构造网络时,应在经验公式的基础上,综合考虑网络的收敛性和其推广能力,经过不断试算,确定 一个折中的隐含层节点数, 使整个网络的性能达到最优。 本文使用的是试验的方法来确定网络的隐含层 节点数,即:先取一个较大的隐含层节点数,如能训练出来,减少隐含层节点数,再训练,多做几次仿 真,从中选择训练步数少,并且检验结果比较精确的结果。

§4-5 本章小结
神经网络模拟了人类大脑的基 本章主要介绍了当前人工智能领域最热门的技术――神经网络技术。 本功能,通过对以往经验和知识进行学习,建立输入输出之间的映射关系,并储在网络中,用于解决新 问题。由于其强大的并行处理能力,及自适应、容错等功能,神经网络得到了广大的应用。本章首先探 讨了人工神经网络的发展及其理论基础, 重点对神经网络的组成部分-神元的结构和工作原理进行了详 细介绍,并对人工神经网络的典型模型及其学习规则进行了总结综述。 BP网络是目前应用最为广泛的一种网络, 本章对其进行了详细的介绍。 首先描述了BP网络的一般模 型结构,接着给出了BP算法的具体推导过程,并就算法中几个值得注意的问题进行了讨论。最后利用BP 算法对二阶水槽控制系统的故障进行诊断,并对诊断结果进行分析。
36

河北工业大学硕士学位论文

第五章 遗传算法在故障诊断中的应用
前面介绍的基于神经网络的故障诊断方法无论是基于系统辨识还是基于神经网络的黑箱建模,所 有的方法实质上都是使用梯度下降算法来实现的,这种算法是一种局部搜索、寻优算法,由此得出的 解可能是局部最优解。这是由于在 BP 算法中,网络权值依赖准则函数的一阶导数信息来修改,当求 解空间存在多个局部极小值时,一旦随机产生的网络初始权值设置不当便会陷入局部收敛。 遗传算法(Genetic Algorithm, GA)是一种进化论的数学模型,是在思想上标新立异的优化方法。通 过对生物进化过程中繁殖、交叉和变异的自然选择规律的模拟,在“物竞天择,适者生存,优胜劣汰” 的选择原则下,使问题的最优解得以生存,从而实现对问题的优化。将遗传算法和神经网络结合起来, 则可以相互取长补短。本章将遗传算法引入了神经网络权值的优化中本章分析了 BP 算法和 GA 算法 各自的特点,提出了两种改进型 GA-ANN 算法,并用于论文第四章的故障诊断神经网络的学习中,仿 真研究表明了它的可行性和优点。

§5-1 遗传算法简介
5-1-1 遗传算法概述 遗传算法研究的历史比较短,20 世纪 60 年代末期到 70 年代初期,主要由美国 Michigan 大学的 John Holland 和同事、学生们研究形成了一个较完整的理论和方法,从试图解释自然系统中生物复杂 适应过程入手,模拟生物进化的机制来构造人工系统模型。经过 20 余年的发展,取得了丰硕的应用成 果和理论研究进展。 近年来世界范围内形成的进化计算热潮,计算智能已作为人工智能研究的一个重要方向,后来人 自然界的生物由简单到复杂、 由低级到高级、 工生命研究兴起,使遗传算法受到了更加广泛的关注[41]。 由父代到子代,被称为生物的遗传和进化。据达尔文的进化论及自然选择学说,异种间的交配或由于 某种原因物种产生变异,则生成新物种,新物种若能适应环境,在增殖的同时,变异的部分能够一代 代遗传下来;若环境变化,有点物种不能适应,即被淘汰。物种的多样性是生成新物种的必要条件。 又据生物遗传学、分子生物学等研究成果可知,构成生物的基本单元是细胞,细胞核内染色体种包含 有遗传基因,细胞由于能分裂而具备自我复制的能力,分裂之际细胞核内的遗传基因,由于同时被复 制而继承下来。交配使双亲的不同染色体重组,生成新的染色体,其内的遗传基因是由双亲的组成的; 遗传基因的变异也能产生新的染色体。因此,可以说物种的进化主要由细胞中染色体的交叉和变异实 现的。 生物在自然界中的生存繁衍,显示了其对自然环境的优异自适应能力。受其启发,人们致力于对 生物各种生存特性的机理研究和行为模拟,为人工自适应系统的设计和开发提供了广阔的前景。遗传 算法(Genetic Algorithms,简称GA)就是这种生物行为的计算机模拟中令人瞩目的重要成果。遗传算法 所借鉴的生物学基础就是生物的遗传和进化[30]。基于对生物遗传和进化过程的计算机模拟,遗传算法 使得各种人工系统具有优良的自适应能力和优化能力。 遗传算法是模拟生物的遗传和长期进化过程建立起来的一种搜索和优化算法, 它模拟了生物界的优 胜劣汰机制,用逐次迭代法搜索寻优。 5-1-2 遗传算法的基本概念 GA 进行遗传操作的基本对象是个体或染色体(chromosome)。每个染色体是一个知识结构,代表 所要求解的问题的一个可能解。染色体通常用字符串或位串来表示,若干长度的串称为构成染色体的 基因(gene)。
37

过程控制系统执行器与传感器故障诊断研究

基因座是指遗传基因在染色体中所占据的位置(Locus)。 等位基因是指同一基因座上可能有的全部基因(Allele)。 群体(Population)由一组(N个)染色体组成,它代表GA搜索的遗传空间。GA对群体中所包含染色体 的数量(N)很敏感[51]:从维持群体中个体的多样性、防止陷入局部解的角度来考虑,似乎N越大越好, 但是这会明显增加计算量,还可能影响个体竞争。 GA 中用适应度函数(fitness function)来评价染色体的优劣。染色体的适应度值越大,相应染色体 所代表的解越优,生存的概率越大。选择适应度函数的依据是能否有效地指导搜索空间沿着面向优化 参数组合方向,逐渐逼近最佳参数组合,而不会导致搜索不收敛或陷入局部最优。同时要易于计算, 但并不像 BP 算法那样要求函数具有可微性。 5-1-3 遗传算法的基本操作 一、编码(Coding)是将问题解的表示映射成遗传空间解的表示,即用字符串或位串构造染色体, 可分为二进制编码和浮点编码,其相反操作为解码。浮点编码采用自然的表达方式,即染色体在解空 间内以浮点向量的形式直接生成。这样一来,染色体即为解空间,遗传空间即为问题空间。 二、选择(Selection)操作是根据染色体的适应度,在群体中按一定概率选取可作为父体的染色体。 具体说就是根据各个个体的适应度,按照一定的规则或方法,从第 t 代群体 P(t)中选择出一些优良的 个体遗传到下一代 P(t+l)中。 三、交叉(Crossover)操作是按一定概率随机地选择染色体对,然后对染色体对按一定概率随机地 交换基因以形成新的子染色体。具体说就是将群体内各个个体随机搭配成对,对每一对个体,以某个 概率(称为交叉概率,crossover rate)交换它们之间的部分染色体。 四、变异(Mutation)操作是按一定概率随机地改变某个染色体的基因值。 具体说就是对群体内的每 一个个体,以某一概率(称为变异概率,mutation rate)改变某一个或某一些基因座上的基因值。 在遗传算法中使用变异算子主要有以下两个目的: 1、 改善遗传算法的局部搜索能力。 遗传算法使用交叉算子已经从全局的角度出发找到了一些较好 的个体编码结构,它们已接近或有助于接近问题的最优解。但仅使用交叉算子无法对搜索空间的细节 进行局部搜索。这时若在使用变异算子来调整个体编码串中的部分基因值,就可以从局部的角度出发 使个体更加逼近最优解,从而提高了遗传算法的局部搜索能力。 2、维持群体的多样性,防止出现早熟现象。变异算子用新的基因值替换原有的基因值,从而可 以改变个体编码串的结构,维持群体的多样性,这样就有利于防止出现早熟现象。 遗传算法的基本步骤: 首先,确定编码的形式,定义染色体的长度、各基因的意义和表示形式及确定映射关系。然后确 定适应度函数。 算法的大致步骤如下: ①初始化。设置进化代数计数器 t=0;设置最大进化代数 T,计算精度;随机生成 M 个个体作为 初始群体 P(0)。 ②个体评价。计算群体中各个个体的适应度。 ③选择运算。将选择算子作用于群体。 ④交叉运算。将交叉算子作用于群体。 ⑤变异运算。将变异算子作用于群体。群体经过选择、交叉、变异运算之后得到下一代群体。 ⑥终止条件判断。若 t≤T 且没有达到计算精度,则 t=t+1,转到步骤②;否则,以进化过程中所 得到的具有最大适应度的个体作为最优解输出,终止计算。如图 5.1 所示:

38

河北工业大学硕士学位论文

图 5.1 遗传算法流程图 Fig 5.1 the flow plot of GA 5-1-4 遗传算法的形式化描述 本遗传算法可定义为一个 8 元组:

SGA = (C , E , P 0, M , Φ, Γ, Ψ , T )
式中, C 一一-个体的编码方法; E 一一个体适应度评价函数;

P0 一一初始种群; M —一种群的大小; Φ 一—选择算子; Γ 一—交叉算子和交叉概率; Ψ 一—变异算子和变异概率; T 一一遗传的最大代数。
5-1-5 遗传算法的特点 遗传算法是一类可用于复杂系统优化计算的鲁棒搜索算法, 于其它一些优化算法(如单纯形法、 梯 度法、动态规划法、分支定界法等)相比,它主要有下述几个特点: 1).以决策变量的编码作为运算对象。 2).直接以目标函数的值作为搜索信息。 3).同时使用多个搜索点的搜索信息。 4).使用概率搜索技术。 但是, 当前遗传算法在实际应用中存在的主要问题是它容易产生早熟现象、 局部寻优能力较差等。

39

过程控制系统执行器与传感器故障诊断研究

§5-2 BP 神经网络与遗传算法的结合
5-2-1 结合的必要性和可行性 BP 网络是神经网络领域中经常使用的一种简单的前向分层网络。 该类型神经网络具有良好的自适 应、自学习、极强的非线性逼近、大规模并行处理和容错能力等特点。避免了复杂的数学推导,在样 本缺省与参数漂移的情况下能保证稳定的输出。 该网络模型有处于中间层位置的隐含层,采用误差传播算法,并有相应的学习规则可循。特别是 它的数学意义明确,步骤分明的学习算法,使其有更广泛的应用背景。 尽管 BP 网络具有很多显著的优点,但是也存在着一定的局限性,具体描述如下: 1.BP 神经网络采用逆差传播算法训练神经网络,该算法是基于误差函数梯度下降的方向,从输出 层经中间层,然后从中间层到输入层逐层修正神经网络的各个权值和阀值。该算法实质是单点搜索算 法,不具有全局搜索能力。 2.BP 神经网络的全局误差 E 是一个以 S 型函数为自变量的非线性函数,这就意味着由 E 构成的 连接空间不是只有一个极小的曲面,而是存在多个局部极小点的超曲面。 3.BP 神经网络学习训练开始时网络的结构参数是随机给定的,因此存在一定的盲目性。若初始权 值给定的不合适,利用误差逆传播算法训练神经网络容易局部极小。 另一方面,遗传算法容易出现未成熟的收敛,虽然相应的改进方法很多,但主要目的是维持算法 进行中的个体多样性,如调整操作参数,增加种群规模等,而都没有考虑到使改进后的算法具有学习 能力和鲁棒性,这正好是神经网络的优势所在。 由上可知,若能把神经网络和遗传算法结合起来,则可以充分利用两者的优点,使新算法既有神 经网络的学习能力和鲁棒性,又有遗传算法的强全局随机搜索能力。 5-2-2 结合方法 当前,二者的结合主要体现在将遗传算法用于神经网络,即优化网络的权重和优化网络的拓扑结 [48,49,50] 构 。本文主要讨论将遗传算法用于前馈网络的权值优化,其基本思想是将网络的学习过程看成 是在权值空间中搜索最优权值集合的过程。其结合算法的系统结构图如图 5.2 所示:

图5.2 神经网络与遗传算法结合形式 Fig 5.2 The join form of NN and GA 5-2-3 遗传算法的具体实现 1)权系编码 编码就是将神经网络权系数按一定的方式组合,得到遗传算法的染色体个体。常用 的编码方法有两种:二进制编码和实数编码。但二进制编码在权值学习中有明显缺点:一方面不直观;
40

河北工业大学硕士学位论文

另一方面精度不高, 因为连接权值是实数, 将它们用二进制数编码实际上是用离散值来尽量逼近权值, 这就有可能导致因某些实数权值不能被更精确表达而使网络的训练失败;再有,二进制编码时字符串 不能太长或太短,太长将导致遗传算法训练的解空间过大,算法需花费大量时间,太短则使精度不高 。此外,二进制编码中的hamming悬崖也是需注意的一个问题[46,47]。 基于上述原则,我们采用实数编码方法。每个连接权直接用一个实数表示。一个网络的权值分布 用一组实数表达,把与同一隐节点相连的权所对应的实数放在一起。本方法的优点是非常直观,且不 会出现精度不够的情况。 则 2)适应度函数 前馈网络的一个重要的特点就是网络的输出值与期望值间的误差平方和越小, 表示该网络性能越好,因此将适应值函数定义为 f = 1/ E ,其中 E 为误差平方和。 3)遗传算法中初始群体中的个体是随机产生的,群体规模的确定受选择操作的影响很大。群体规 模越大,群体中个体的多样性越高,算法陷入局部解的危险就越小,所以从群体多样性出发,群体规 模应较大。但群体规模太大会增加计算量,从而影响算法效能;同时群体中个体太多时,少量适应度 很高的个体会被选择而生存下来,但大多数个体被淘汰,这会影响配对库的形成,从而影响交叉操作。 另一方面,群体规模太小,会使遗传算法的搜索空间中分布范围有限,因而搜索有可能停止在未成熟 阶段,引起未成熟收敛现象在实际应用时群体个体数的取值范围一般为几十~几百。本文选种群规模 为 30。 4)选择算子采用轮盘赌选择方法(适应度比例方法),即每个个体的选择概率和适应值成正比。另 外,新群体中最大适应度值若小于父代群体中最大适应值,则将父代群体中适应值最大的个体无条件 地直接复制到下一代。 5)交叉算子由于实数编码时其等位基因的类型不再是布尔型,其交叉方式也就不同于二进制编码 方式。 一般主要是采用算术交叉, 该交叉算子与一般交叉算子的区别在于, 算术交叉并不是简单的 “基 [41] 因”交换,而是对基因进行线性组合。算术交叉又分为部分算术交叉与整体算术交叉 ,具体操作过 程简述如下: 为了叙述的方便,设两父代解向量分别为 x1 = ( x1 , x 2 , ? ? ?, xm ) 和 x 2 = ( x1 , x 2
(1) (1) (1) (2) (2)

, ? ? ?, xm (2) ) 。

部分算术交叉是先在父代解向量中选择一部分分量,如第 K 个分量以后的所有分量进行,则生成

m ? K 个随机数 α i ∈ (0,1) , i = K + 1, K + 2, ? ? ?m, ,交叉后生成的子代为:

x1 = (x1(1) , x1(1) , ? ? ?, xk (1) ,αk + 1xk + 1(1) + (1?αk + 1)xk + 1(2) , ? ? ?,αmxm(1) + (1?αm)xm(2) )
x2 = (x1(2) , x1(2) , ? ? ?, xk (2) ,α k + 1xk + 1(2) + (1?α k + 1)xk + 1(2) , ? ? ?,α mxm(2) + (1?α m)xm(1) )
而整体算术交叉与部分算术交叉相似,只不过是对所有的分量进行操作,本文采用了部分算术交 叉算子。 6)变异算子遗传算法中引入变异的目的有两个:其一是使遗传算法具有局部的随机搜索能力;其 二是使遗传算法可维持群体多样性,以防止出现未成熟收敛现象。使用实数编码时变异算子不再象二 进制编码时仅仅是简单地恢复群体的多样性,它已经成为一个重要的算子。本文采用了非一致性变异 。 算子[41] 。 5-2-4 遗传算法和 BP 算法相结合方式 应用研究表明,目前一些常规遗传算法并不一定是针对某一问题的最佳求解方法。而将遗传算法 与问题的特有知识集成到一起所构成的混合遗传算法,却有可能产生求解性能极佳的方法,这也为继 续提高遗传算法的搜索性能提供了新的思路。基于这一思想,本论文尝试着将遗传算法和 BP 算法相
41

过程控制系统执行器与传感器故障诊断研究

结合,考虑到这两种算法的不同结合方式,本文提出了遗传算法和 BP 算法两种不同的结合模式。 遗传算法和 BP 算法相结合一: 1、对于优化参数进行编码生成初始群种; 2、用遗传算法优化种群; 3、计算相应量,看其是否满足于与 BP 算法之间的转换条件(在本文中,转换条件直接定位最大 遗传代数 gm =100),若满足,则进入下一步;否则,继续用遗传算法优化种群; 4、将染色体进行解码,用 BP 算法优化种群; 5、计算网络的目标误差,看其是否满足结束条件,若满足,则训练结束;否则,继续采用 BP 算 法优化种群。 其流程图如图 5.3 (a)所示。 遗传算法和 BP 算法相结合二: 1、对于优化参数进行编码生成初始群种; 2、用遗传算法对种群优化; 3、将染色体进行解码,用 BP 算法优化解空间,然后进行再次编码产生新的种群; 4、计算网络的目标误差,看其是否满足结束条件,若满足,则训练结束;否则,返回到第二步, 直至满足条件为止。 其流程图如图 5.3(b)所示。 可以看出,这种混合遗传算法是在标准遗传算法中融合了局部搜索算法的思想。 第一种算法是先进行遗传运算,由应用 BP 算法进行优化。即先随机产生初始种群,采用遗传算 法优化种群,对网络进行循环训练,直到达到与 BP 算法的转化条件为止,然后,把遗传算法优化后 的种群解码,将其作为初始权值,用 BP 算法接着优化权值,同样对网络进行循环训练,直至网络的 目标误差满足精度要求。 第二种算法是遗传算法和 BP 算法同步进行,即先随机产生初始种群,采用遗传算法优化种群一 代,把得到的新种群解码,将其作为初始权值,用 BP 算法进行优化一次,产生新的权值和阀值,然 后计算网络的目标误差,看其是否满足精度要求,若满足,则训练结束;若不满足,则将得到的权值 和阀值重新编码,将其作为初始种群,重新开始训练。

42

河北工业大学硕士学位论文
产生初始种群 产生初始种群

编码

编码

选择运算

选择运算

交叉运算

交叉运算

变异运算

变异运算

新种群

新种群

是否满足 转换条件



解码


解码

应 用 B P算 法 优化解空间

应 用 B P算 法 优化解空间

计算网络误差, 看是否满足条件



计算网络误差, 看是否满足条件




结束


结束

( a)

( b)

图5.3 采用GABP混合算法网络模型的流程图 Fig.5.3 The flow chart of GABP neural network 5-2-5 遗传算法中的参数的选取 对于遗传算法中的参数的选取是在网络结构预先给定的情况下进行的,即网络有三层,输入层有 14 个神经元,输出层有 6 个神经元,中间层给定为 20 个神经元。此时对于网络权值的修正仅采用遗 传算法,并给定其最大的遗传代数为 80。 遗传算法中的参数主要有:①编码方法的确定;②适应度函数的选取;③选择算子的选取;④交 叉算子的选取和交叉概率的确定;⑤遗传算子的选取和遗传概率的确定;⑥种群规模的确定。 下面分别介绍各个参数的确定: 一、编码方法的确定 通常采用的一维染色体编码技术有二进制编码(二进制编码是将问题空间的候选解转换成遗传空 间的各位数值为“0”或“1”的字符串)和浮点编码(浮点编码,是将每个染色体向量被编码成一个与 解向量相同长度的浮点数向量,在执行上,遗传空间就是问题空间,染色体直接反映了问题的规律和 特性)。本文采用了浮点编码,主要基于浮点编码与二进制编码相比有以下优点:①精度依赖于所使用
43

过程控制系统执行器与传感器故障诊断研究

的机器,与编码本身无关,比二进制要灵活、方便;②浮点编码能够表达很大的区域,而二进制编码 必须以牺牲精度来增加表达区域;③容易设计出封闭的、动态的遗传算子,容易处理非常规约束。 对于控制系统故障诊断预测模型而言,有 14 个输入单元,20 个隐藏单元,6 个输出单元。一条 染色体的组成主要有网络的权值和阀值,再加上其自身的适应度函数值,则每个个体共有 20x14+6x35+20+6+=517 个基因。根据用 BP 算法确定最优权值的范围,确定在遗传算法中,权值的初 始取值范围为(-1, 1 )。 二、适应度函数的选取 在遗传算法的进化过程中,对染色体的评价是由适应度函数来完成的,适应度函数的函数值作为 选择运算的依据。由于进化的准则是“优胜劣汰” ,即遗传算法向着适应值增加的方向进化,所以目标 函数的寻优方向该与适应度函数增加的方向一致,这是确定适应度函数的先决条件。在本文中遗传算 法所要解决的问题是优化网络的权值,而优化网络的权值是为了减小网络的目标误差函数值,所以在 本文中将适应度函数选取为网络目标误差函数的倒数,即为公式 5-1 所示:
f (i) = 1 / E (i)

三、交叉概率和变异概率的确定 1、交叉概率 交叉是最主要的遗传运算,遗传算法的性能在很大程度上取决于所采用的交叉算子的性能和交叉 概率的大小。交叉率是指各代中交叉产生的后代数与种群规模之比。交叉运算产生新个体,不断拓展 搜索空间,较高的交叉率可以搜索更大的解空间,从而降低了停在非优解的机会;但是交叉率太高, 会因搜索不必要的解空间而耗费大量的计算时间。常用的交叉率的取值范围为(0,1)。本文选取不同 的交叉概率 pc ∈ {0.8;0.6;0.5;0.4;0.2}进行试算。 2、变异概率 变异率控制了新基因引入的比例。若变异率太大,随机的变化太大,那么后代就可能失去从双亲 继承下来的好的特性;若变异率太小,一些有用的基因就没有机会产生。常用变异率的范围为 (0.001 ,0.1)。本文选取不同的变异概率 pm ∈ {0.001;0.004;0.01;0.05;0.08}进行试算。

§5-3 仿真研究
遗传算法应用于神经网络的一个方面是用GA学习ANN的权重,也就是用遗传算法取代一些传统的 学习算法。另一个方面是用来优化人工神经网络(ANN)的结构。 5-3-1 仿真遗传算法和 BP 算法相结合一 利用第四章提到的网络结构,输入层14个节点,中间层20节点,输出层6节点。训练数据与表4-1 相同,训练精度参数设置同于第四章。 GA优化网络步骤为: ①初始化种群 P , 包括交叉规模、 交叉概率 Pc 、 突变概率 Pm 以及对任一 WIHij 和 WHOji 初始化; 在编码中,采用实数进行编码,初始种群取30; ②计算每一个个体评价函数,并将其排序,可按下式概率值选择网络个体:

pi = fi / ∑ fi
i =1

N

其中 fi 为个体i的适配值,可用误差平方和 E 来衡量,即:

f (i ) = 1/ E (i )

其中 E (i ) =

1 ∑∑ (Vk ? Tk )2 2 p k

44

河北工业大学硕士学位论文

其中 i = 1, ? ? ?, N 为染色体数; k =1,…,6为输出层节点数; p 为学习样本数; Tk 为教师信号。 ③以概率 Pc 对个体 Gi 和 Gi + 1 交叉操作产生新个体 G ' i 和 G ' i + 1 ,没有进行交叉操作的个体进行直 接复制; ④利用概率 Pm 突变产生 Gi 的新 G ' i 个体; ⑤将新个体插入到种群 P 中,并计算新个体的评价函数; ⑥ 计算ANN的误差平方和,若达到预定值εGA,则转⑦,否则转③,继续进行遗传操作 ⑦ 以GA遗传出的优化初值作为初始权值,用BP算法训练网络,直到指定精度εBP(εBP<εGA)。 用GA-BP算法训练前面的神经网络,其遗传算法误差平方和曲线、适应度曲线和BP算法的训练目 标曲线分别见图5.4的(a)、(b)。

图5.4(a) GA-BP算法的均方差与适配值曲线图 Fig 5.4(a) The sum-squared sum error and fitness of GA-BP

5.4(b) GA-BP算法的均方差图 Fig 5.4 The sum-squared sum error of GA-BP

训练后的回想结果为 TT = 0.9861 0.0087 0.0006 -0.0024 -0.0006 -0.0040 -0.0004 1.0059 0.0026 0.0003 0.0024 0.0028 0.0024 -0.0016 0.9991 0.0011 0.0004 0.0014 -0.0134 0.0110 -0.0005 0.9983 0.0019 -0.0011 0.0155 -0.0145 -0.0017 0.0016 0.9984 0.0012 0.0200 -0.0196 -0.0010 0.0037 -0.0050 0.9998 取另一传感器卡死数据输入网络得: Y4=-0.0002 -0.0012 0.0003 1.0001 0.0002 0.0001 经过多次仿真与BP算法相比,GA-BP算法在学习时间上大为缩短,显示出优越性。图5.5(a)、(b)为用

45

过程控制系统执行器与传感器故障诊断研究

GA优化神经网络后的自适应BP算法。

图5.5(a) GA-自适应BP算法的均方差与适配值曲线图 Fig 5.5(a) The sum-squared error and fitness value change plot of GA-self Adapt BP arithmetic

图5.5(b) GA-自适应BP算法的学习率与均方差变化图 Fig 5.5(b) The sum-squared error and learning rate change plot of GA-self adapt BP arithmetic 经过对比可以GA-自适应BP算法无论在学习时间还是反传步数上都有明显优势。 5-3-2 仿真遗传算法和 BP 算法相结合二 网络结构与参数同上,仿真步骤为: ①初始化种群 P ,包括交叉规模、交叉概率 Pc 、突变概率 Pm 以及对任一 WIHij 和 WHOji 初始化; 在编码中,采用实数进行编码,初始种群取30; ②计算每一个个体评价函数,并将其排序,可按下式概率值选择网络个体:

46

河北工业大学硕士学位论文
N

pi = fi / ∑ fi
i =1

其中 fi 为个体i的适配值,可用误差平方和E来衡量,即: f (i ) = 1/ E (i ) 其中 E (i ) =

∑∑ (V
p k

k

? Tk ) 2

其中 i = 1, ? ? ?, N 为染色体数; k =1,…,6为输出层节点数; p 为学习样本数; Tk 为教师信号。 ③以概率 Pc 对个体 Gi 和 Gi + 1 交叉操作产生新个体 G ' i 和 G ' i + 1 ,没有进行交叉操作的个体进行直 接复制; ④利用概率 Pm 突变产生 Gi 的新 G ' i 个体; ⑤将新个体插入到种群 P 中,并计算新个体的评价函数; ⑥如果找到了满意的个体,则结束,否则转③。 达到所要求的性能指标后,将最终群体中的最优个体解码即可得到优化后的网络连接权系数。 遗传代数设为5000,仿真结果如图5.6所示:

图5.6适配值与均方差变化图 Fig 5.6 The fig fitness value and sum-squared error 由于用遗传算法学习神经网络的权值是对全局进行全局优化,误差每反传一次都要进行一次遗传 操作,所以在训练时间上太长。

§5-4 本章小结
本章简要介绍了遗传算法的发展史、遗传算法的特点以及用遗传算法优化传统神经网络的初始权 值。采用两种遗传算法与神经网络结合的算法对控制系统进行故障诊断,仿真结果表明,该算法在缩短 神经网络学习时间上有明显效果。
47

过程控制系统执行器与传感器故障诊断研究

第六章 结论
故障诊断是一门综合性交叉学科, 是在不断吸收其它学科和领域的新理论、 新技术和新方法的基础 上向前发展的一门应用技术。 故障的检测与诊断在现代工业生产中有着重要的作用, 然而如何提高检测 与诊断的正确率、 可靠性以及适应能力, 一直以来是研究中的重要课题, 本文就此作了一些有益的探讨。 针对对象的精确模型描述,可以从机理上反映出系统所具有的动、静态特性。系统在运行过程中可 能出现的任何状态改变或故障现象,均能在模型的相应部分体现出来。但是,在实际的诊断中,对象的 或者虽然得到了某一时刻的准确模型, 随着运行时间的推移, 系统参数发生漂移, 模型很难精确获得, 但 模型的准确性变差, 此时由传统的基于模型的故障诊断方法得到的诊断结果的可靠性显著下降, 对故障 的误报率增加。 人工神经网络在处理信息方面具有:并行性、鲁棒性、记忆性、自组织性等显著优势,己经被很多 学者作为进行故障诊断研究的主要手段。一些典型的神经网络结构,也已成功的应用于实际。传感器与 受干扰的因素也比较多, 执行器故障诊断的信息量通常较大, 因此采用神经网络进行诊断是一种较理想 的解决方法。当然,和其它诊断方法一样,基于神经网络的故障诊断也存在缺点:在神经网络诊断过程 中,其自身权值、阀值对应的物理意义不明确;神经网络算法的实现较为复杂;用软件的方式实现很难 体现出神经网络并行处理数据的能力,而用硬件的方式实现成本较高等。 随着人工智能技术的迅速发展,特别是人工神经网络、遗传算法在故障诊断领域中的应用,使故障 诊断正朝着智能化方面发展,且己取得了令人满意的成绩。但是人工神经网络本身也有其局限性,它收 敛速度慢甚至不收敛、不易达到全局最优解,并且其初始权值的随机性很大。本文针对BP神经网络易陷 于局部极小值和运算速度慢和遗传算法易出现未成熟收敛的缺点, 研究了将两者结合起来的GA-BP算法, 该算法既具有BP算法的较强的局部搜索能力和非线性映射能力,又有遗传算法的强的全局搜索能力。 本文主要工作: (1)针对过程控制系统特性,对系统建立数学模型,分析系统可能出现的故障并对故障进行建模仿 真。 (2)采用基于数学模型的方法,建立状态观测器对系统进行诊断。 (3)对于建立数学模型困难的系统,本文提出基于神经网络的方法。网络输入为故障征兆,输出为 故障类型,采用BP算法中的梯度下降法和学习率自适应法分别进行仿真,仿真结果表明,该方法具有可 行性。 (4)针对BP神经网络易陷于局部极小值和运算速度慢缺点,本文研究了将遗传算法与神经网络结合 起来的GA-BP算法,采用两种方法对两种算法结合,经过仿真表明,该算法在网络运算速度上有明显提 高

48

河北工业大学硕士学位论文

参考文献
[1] 闻新,张洪钱,周露.《控制系统的故障诊断和容错控制》,机械工业出版社,1998年版2月第1版 [2] 周东华,孙优贤.《控制系统故障检测与诊断技术》,清华大学出版社,1994年版9月第1版 [3] 周东华,叶银忠.现代故障诊断与容错控制.北京:清华大学出版社,2000 [4] 张立明人工神经元网络的模型及应用复旦大学出版社1993.7 [5] DanHorak. System Failure Isolation in Dynamic Systems,J.GUIDANCE.NOVDE C. 1990, pp 1075-1082 [6] MarcelloR .Napoitano.C hingI .Chena ndS teveN aylor.Aircraft Failure Detection and Identific at io n Using NeuralN etworks,JOURNAL OF GUIDANCE,CONTROL,AND DNAMICS ol .No.6, November-December1 993,pp.999-1009 [7] Garcia EA, Frank PM, On the relationship between observer and parameter identification based approaches to fault detection,Pro.of IFAC World Congress, 1996,25-29 [8] Jie Zhang. Recurrengt Neuro-Fuzzy Nerworks for Nonlinear Process Modeling. IEE Transations on Neural Networks,No2 March 1999 [9] D.Jiang .A Recurrent Neural Network for Real-Time Semidefinite Programming .IEE Transations on Neural Networks, Nol January 1999 [10] 郑大钟,《线性系统理论》,清华大学出版社,2003年10月第2版 [11] 杨行峻,郑君里.人工神经网络与盲信号处理.北京:清华大学出版社,2003,301一324 [13] 虞和济,陈长征,张省等,基于神经网络的智能诊断,北京:冶金工业出版社,2000. [14] 钟秉林,黄仁,机械故障诊断学,北京:机械工业出版社,1997. [15] C. Commault, J. M. Dion, O. Sename, R. Motyeian. Observer Based Fault Detection for Structured Systems. IEEE Transaction on Automatic Control, 2002,47(12): 2073-2079. [16] M. Saif, Y. Guan. A New Approach to Robust Fault detection and Identification. IEEE Transaction on Aerospace and Electronic Systems. 1993, 29(3): 684-695. [17] J. Chen, R. J. Patton, H. Y. Zhang. Design of Unknown Input Observer and Robust Fault Detection Filters. International Journal of Control, 1996, 63(1): 84-105. [18] J. Chen, R. J. Patton. Optimal Filtering and Robust Fault Diagnosis of Stochastic Systems with Unknown Disturbances. IEEE proceedings of Control Theory Application, 1996, 143(1): 31-36. [19] F. Caliskan, C. M. Hajiyev. Aircraft Sensor Fault Diagnosis Based on Kalman Filter Innovation Sequence. Proceedings of 37th Conference on Decision & Control. Tampa, USA, 1998: 1313-1314. [20] J. Y. Keller. Fault isolation filter design for linear stochastic systems. Automatica, 1999, 35: 1701-1706. [21] E. C. Larson, B. E. P. Jr, B. R. Clark. Model-Based Sensor and Actuator Fault Detection and Isolation. Proceedings of the American Control Conference, Anchorage, 2002: 4214-4219. [22] D. Juricic, M. Zele. Robust Detection of Sensor Faults by Means of A Statistical Test. Automatica, 2002, 38: 737-742. [23] 周东华,叶银忠.现代故障诊断与容错控制.清华大学出版社,2000. [24] 胡昌华,许化龙.控制系统故障诊断与容错控制的分析和设计.北京:国防工业 [25] J. Q. Zhang, Y. Yan. A Wavelet-Based Approach to Abrupt Fault Detection and Diagnosis of Sensors. IEEE Transactions on Instrumentation and Measurement, 2001, 50(5): 1389-1396. [26] 王德军.故障诊断与容错控制方法的研究,吉林大学硕士学位论文,2004. [27] 崔家骥,现代控制系统设计理论的新发展,北京:科学出版社,1996,85~86 [28] R. V. Beard. Failure Accommodation in Linear Systems through Self-reorganization. Report MVT-71-1,
49

过程控制系统执行器与传感器故障诊断研究

Man Vehicle Lab, MIT, Cambridge,Massachusetts, 1971. [29] 张海琳,杨平.传感器的故障诊断技术研究机电一体化 2001 [30] 李敏强.遗传算法的基本理论和应用.科学出版社,2002. [31] Catelani M, A Fort. Soft fault detection and i solation in analog circuit: some result and a comparison basis function network. IEEE Trans. Instrumentation and measurement, 2002, 51 (2):196 一 202 [32] 王旭,王宏,王文辉.人工神经元网络原理东北大学出版社,2000. 12 [33] 王伟.人工神经元网络原理:入门与应用北京航空航天大学出版社,1995. 11 [34] 张立明.人工神经元网络的模型及应用复旦大学出版社,1993.7 [35] 从爽. 神经网络、模糊系统及其在运动控制中的应用中国科学技术大学出版社,2002.5 [38] 王悦民,潜伟建.改进的 BP 算法在柴油机故障诊断中的应用研究[J].海军工程人学学报,2000,4: 36-40 [39] 王宝树.遗传算法及神经网络在数据融合中的应.西安电子科技大学,2001,1 [40] 赵军.基于遗传算法和神经网络模型的智能化拉深参数实时识别.燕山大学,2002,3 [41] 梁化楼, 戴贵亮.人工神经网络与遗传算法的结合进展及展望[J].电子学报.1995,23 (10): 194-- 200 [42] 王正志,薄涛著.进化计算.长沙:国防科技大学出版,,2000 [43] Battiti R.First and、 second-order methods for learning: Between steepest descent and Newton's method[J].Neural computation,1992,4(2):141 一 166 [44] Jacbs R A.Increased rates of convergence through learning rate adaptation [J].Neural Networks, 1988, 1(4):295307 [45] 许飞云,贾民平,钟秉林,黄仁.旋转机械振动故障诊断的一种模糊神经网络方法研究[J].振动工 程学报,1996,9(3):213219 [46] 齐明侠.大型柴油机故障诊断智能化的研究[D].北京:石油大学工学,1999. [47] Rumelhart D E.Learning internal representations by back-propagating errors[M]. Nature,1986,533-536 [48] 焦李成.神经网络系统理论[J].西安:西安电子科技大学出版社,1999 [49] 张立明.人工神经网络的模型及其应用[M].上海:复旦大学出版社,1993 [50] 郑志军,郑守淇.用基于实数编码的自适应遗传算法进化神经网络.计算机工程与应用.2000,9:36 -38 [51] 张明辉,王尚锦.自适应搜索的改进遥传算法及其应用.西安交通大学学报,2002,3(3):226-230 [52] 王翼.现代控制理论[M].北京:机械工业出版社,2005,87-89

50

河北工业大学硕士学位论文

致 谢

在研究生学习期间以及在论文的完成过程中,本人无论在基拙理论方面还是在科研水平上都取得 了的进步,这一些都离不开导师梁秀霞副教授认真细致的指导。梁老师对我不仅在学业上言传身教, 孜孜不倦,而且在生活上也是关怀备至。正是梁老师严谨的治学态度、细致入微的教导,鼓舞我不断 探索,并顺利完成了本文的研究工作。在我完成硕士论文的全过程中:从论文题目的拟定,研究方向 的确定,到论文的纂写和最后的定稿,都浸透着梁老师的心血。梁老师学术上的严谨和处处为他人着 想以及待人诚恳给我留下了深刻的印象,定会使我在今后的工作和生活中受益匪浅,在此谨向恩师致 以我最崇高的敬意和最衷心的感谢! 在这里尤其感谢过程控制实验室的李焕芝老师, 李老师经常询问我的学习和生活情况, 教育我时刻 以学习为重,多学习、多积累、多实践,为以后的工作打好基础。在基础知识学习和运用方面得到了李 老师的热心帮助与无私指导, 对我的学习研究给予了重要的帮助。 值此论文完成之际衷心祝愿李老师全 家幸福安康。 感谢 04 届机械制造、景观设计、控制科学和检测技术的同学们,谢谢你们对我的关心和帮助。 在研究生期间认识各位朋友同学是我人生的一大财富。 最后要感谢我的家人,是他们倾尽全力,无私地给了我精神和物质上的支持。有了他们的鼓励, 才使我有勇气在求知的道路上继续探索下去。

51

过程控制系统执行器与传感器故障诊断研究

攻读学位期间所取得的相关科研成果

[1] 梁秀霞, 刘志伟, 谢涛娟,刘俊峰. 基于 MC68HC908AB32 的电动助力转向系统.电力电子技术, 2006.6,p74-77 [2] 梁秀霞,刘志伟,韩金芬,刘俊峰. 基于 RS485 总线的过程控制运行参数在线监测系统的研究. 中 国控制与决策第 18 届学术年会.2006 年 7 月,p1390-1393 [3] LIANG-XIUXIA , WANG-XIAOYE, LIU-ZHIWEI ,CHEN-ZENGQIANG ,YUAN-ZHUZHI. STUDY ON ALGORITHM OF CONSTRAINED MULTIVARIABLE GENERALIZED PREDICTIVE CONTROL. 第六 届机器学习与控制论国际会议. 2006 年 8 月. EI 收录

52

过程控制系统执行器与传感器故障诊断研究
作者: 学位授予单位: 刘志伟 河北工业大学

本文链接:http://d.g.wanfangdata.com.cn/Thesis_D042192.aspx


搜索更多“过程控制系统执行器与传感器故障诊断研究”

网站地图

All rights reserved Powered by 伤城文章网 5xts.com

copyright ©right 2010-2021。
伤城文章网内容来自网络,如有侵犯请联系客服。zhit325@126.com