1、第7章软测量技术第7章软测量技术7.1概述概述7.2软测量方法软测量方法思考与练习题思考与练习题第7章软测量技术7.1概概述述7.1.17.1.1软测量技术的概念和分类软测量技术的概念和分类传统的测量技术通常是建立在传感器等硬件基础上的,而软测量则是通过状态估计的方对无法在线测量的参数进行在线估计,这些状态估计通常都是建立在以可测变量为输入、被估计变量为输出的数学模型上的。软测量的基本思路是,根据某种最优准则选择一组既与主导变量(即待测变量或待估变量)有密切联系而又容易测量的变量称为辅助变量(又称二变量)的量,通过构造某种数学关系用计算机软件实现对主导
4、分为随机误差和过失误差两类,前者受随机因素的影响,如操作过程的微小波动或检测信号的噪声等;后者包括仪表的系统偏差和故障(如堵塞、校正不准或零点漂移甚至仪器失灵等),以及不完全或不正确的过程模型(泄漏、热损失等)。第7章软测量技术3)软测量模型的建立软测量模型是研究者在深入理解过程机理的基础上,开发出的适用于估计的模型,它是软测量方法的核心。不同生产过程的过程机理不同,其测量模型千变万化,因此软测量模型的建立方法和过程也有差异。第7章软测量技术4)软测量模型的在线校正由于过程的时变性,软测量模型的在线校正是必要的。尤其对于复杂的工业过程,很难想象软测量模型能够“一次成型”、“
6、,通过对过程对象的机理分析,找出不可测主导变量与可测辅助变量之间的关系(建立机理模型),从而实现对某一参数的软测量。对于工艺机理较为清楚的工艺过程,该方法能构造出性能良好的软仪表;但是对于机理研究不充分、尚不完全清楚的复杂工业过程,则难以建立合适的机理模型。第7章软测量技术2)基于回归分析的软测量建模经典的回归分析是一种建模的基本方法,应用范围相当广泛。以最小二乘法原理为基础的回归技术目前已相当成熟,常用于线性模型的拟合。对于辅助变量较多的情况,通常要借助机理分析,首先获得模型各变量组合的大致框架,然后再采用逐步回归方法获得软测量模型。为简化模型,也可采用主元回归分析法和部分最
7、小二乘回归法等方法。基于回归分析的软测量建模方法简单实用,但需要足够有效的样本数据,对测量误差较为敏感。第7章软测量技术3)基于人工神经网络的软测量建模基于人工神经网络的软测量建模方法是近年来研究最多、发展很快和应用范围很广的一种软测量建模方法。由于能适用于高度非线性和严重不确定性系统,因此它为解决复杂系统过程参数的软测量问题提供了一条有效途径。采用人工神经网络进行软测量建模有两种形式:一种是利用人工神经网络直接建模,用神经网络来代替常规的数学模型描述辅助变量和主导变量间的关系,完成由可测信息空间到主导变量的映射;另一种是与常规模型相结合,用神经网络来估计常规模型的模型参数,进而
8、实现软测量。第7章软测量技术4)基于模式识别的软测量建模这种软测量建模方法是采用模式识别的方法对工业过程的操作数据进行处理,从中提取系统的特征,构成以模式描述分类为基础的模式识别模型。基于模式识别方法建立的软测量模型与传统的数学模型不同,它是一种以系统的输入、输出数据为基础,通过对系统特征提取而构成的模式描述模型。该方法的优势在于它适用于缺乏系统先验知识的场合,可利用日常操作数据来实现软测量建模。在实际应用中,这种软测量建模方法常常和人工神经网络以及模糊技术等结合在一起使用。第7章软测量技术5)基于模糊数学的软测量建模基于模糊数学的软测量模型是一种知识性模型。该方法特别适合应
10、的状态变量关于辅助变量是完全可观的,那么软测量问题就转化为典型的状态观测和状态估计问题。采用Kalman滤波器和Luenberger观测器是解决问题的有效方法。前者适用于白色或静态有色噪声的过程,而后者则适用于观测值无噪声且所有过程输入均已知的情况。第7章软测量技术7)基于过程层析成像的软测量建模基于过程层析成像的软测量建模方法与其他软测量建模方法不同的是,它是一种以医学层析成像技术为基础的在线获取过程参数二维或三维的实时分布信息的先进检测技术,即一般软测量技术所获取的大多是关于某一变量的宏观信息,而采用该技术可获取关于该变量微观的时空分布信息。由于技术发展水平的制约,这种软测量建模方
13、神经网络或模糊数学等人工智能技术相结合。第7章软测量技术7.1.27.1.2影响软测量仪表性能的因素影响软测量仪表性能的因素1.1.辅助变量的选择辅助变量的选择1)变量的选择原则辅助变量的选择要基于对过程的机理分析和实际工况的了解。有关文献建议辅助变量的选择应符合如下原则:(1)过程适用性,工程上易于在线获取并有一定的测量精度。(2)灵敏性,对过程输出或不可测扰动能做出快速反应。(3)特异性,对过程输出或不可测扰动之外的干扰不敏感。(4)准确性,构成的软测量仪表应能够满足精度要求。(5)鲁棒性,对模型误差不敏感等。第7章软测量技术2)变量数目的选
14、择辅助变量的个数的下限值为被估计主导变量的个数,但直接使用过多辅助变量会出现过参数化问题,其最佳数目的选择与过程的自由度、测量噪声以及模型的不确定性有关。至于如何选取最佳个数还是一个有待研究的问题,至今尚无较统一的结论。一般建议从系统的自由度出发,先确定辅助变量的最小个数,再结合实际过程中的特点适当增加,以便更好地处理动态特性的问题。第7章软测量技术3)检测点位置的选择对于许多工业工程,与各辅助变量相对应的检测点位置的选择是相当重要的。典型的例子就是精馏塔,因为精馏塔可供选择的检测点很多,而且每个检测点所能发挥的作用各不相同。一般情况下,辅助变量的数目和位置常常是同时确定的,用于选择变
15、量数目的准则往往也被用于检测点位置的选择。第7章软测量技术2.2.测量数据的处理测量数据的处理1)测量误差处理在实际应用中,过程数据来自现场,受测量仪表精度、可靠性和现场测量环境等因素的影响,不可避免地要带有各种各样的测量误差,采用低精度或失效的测量数据可能导致软仪表测量性能的大幅度下降,严重时甚至导致软测量的失败,因此对测量数据的误差处理对保证软仪表正常可靠运行非常重要。测量数据的误差可分为随机误差和过失误差两大类。第7章软测量技术2)测量数据变换测量数据不仅影响模型的精度和非线性映射能力,而且对数值算法的运行效果也有重要作用。测量数据的变换包括标度、转换和权函数
16、三个方面。实际测量数据可能有着不同的工程单位,各变量的大小间在数值上可能相差几个数量级,直接使用原始测量数据进行计算可能丢失信息和引起数值计算的不稳定,因此需要采用合适的因子对数据进行标度,以改善算法的精度和计算稳定性。转换包括对数据的直接换算和寻找新的变量替换原变换变量两个方面,通过对数据的转换,可有效地降低非线性特性。而权函数则可实现对变量动态特性的补偿。第7章软测量技术33软测量的在线校正软测量的在线校正工业实际装置在运行过程中,随着操作条件的变化,其过程对象特性和工作点不可避免地要发生变化和漂移,因此在软仪表的应用过程中,必须对软测量模型进行在线校正才能适应新的工况。软测
18、例。这里主要介绍多元线性回归分析。假设m个自变量为xi(i=1,2,3,,m),因变量为y,y可表示为自变量xi的线性组合,即exxxexxxfymmm.),.,(2211021(7-1)第7章软测量技术式中,为待定的多元线性回归函数的回归系数;e为服从正态分布的测量误差。多元线性回归的目的就是通过自变量的n组测量估计出回归系数。用软测量技术求解回归系数最佳估计就是将m个自变量作为辅助变量,因变量y为待测主导变量,呈如式(7-1)表示的线性关系,采用多元线性回归估计出回归系数,建立线性回归模型,并基于软测量模型实现待测主导变量y的估计。第7章软测量技术多元线性回归的数学模型
19、可表示为nmnmnnmmneeeExxxxxxxxxXyyyYEXY.,.,.1.1.1,.2121212.22211121121(7-2)第7章软测量技术根据最小二乘原理,的最小估计值为则得软测量模型为YXXXTT1)(mmxxy.110(7-3)回归方程获得后,一般需要对回归方程和回归系数进行显著性检验以评价线性拟合的品质和自变量xi对因变量y的影响。在多元回归分析中,自变量的恰当选择是确保获得有效回归方程的关键。自变量选择得不好,不但影响回归函数的质量,也常常抵消具有显著作用的自变量在回归分析中的作用。因此,剔去回归分析中作用不显著的自变量具有重要意义。第7章软
20、测量技术2.偏最小二乘回归方法偏最小二乘回归方法偏最小二乘回归的运算过程可以简单描述如下:设有两组变量X和Y。X由p个分量(x1,x2,x3,,xp)构成,Y由q个分量(y1,y2,y3,,yq)构成。若现在有n个数据和相应的影响因素值,可以获得两个矩阵X=(x1,x2,x3,xp)np和Y=(y1,y2,y3,,yq)nq。偏最小二乘回归分析首先在X与Y中提出成分t1和u1,t1是(x1,x2,x3,xp)的线性组合,u1是(y1,y2,y3,yq)的线性组合。在成分提取时要满足下列两个要求:(1)t1和u1尽可能大地携带它们各自数据表中的变异信息;(2)t1和u1的相
21、关程度能够达到最大。第7章软测量技术3.基于最小二乘法的糖液过饱和度软测量基于最小二乘法的糖液过饱和度软测量1)Wright模型蔗糖的结晶过程,就是把糖浆浓缩至一定的过饱和状态,使之析出微小的晶核,控制糖液的过饱和系数在最适当的范围而使晶体长大的过程。在煮制过程中必须控制好过饱和系数在适当的范围。如果过大,将导致糖液自行析出微小结晶,即伪晶;如果过小,则无法使糖液中的糖分析出结晶。由于煮糖过程存在着严重的非线性,因此数据的采集比较困难。纯净的蔗糖溶液的溶解度与温度有关,并遵循Charles给出的计算公式:100)100(04.9)100(57.20100)100(251.74
22、07.6432TTTWSS(7-4)第7章软测量技术定义变量X如下:3825401004.910057.210251.76447.0TTTX(7-5)这个方程可以转化为蔗糖对水的质量比,它仍然是同温度有关的。001XXWS(7-6)纯净蔗糖溶液的过饱和系数定义为)()/WSWSSS(水糖同温度下饱和糖液中蔗水糖某温度下被测糖液中蔗第7章软测量技术在实际生产中,糖液中含有蔗糖外的多种杂质,这些杂质都将对糖液的过饱和度产生影响。因此,过饱和度定义为)()()()(WSSCWSWSWSSSiii(7-7)其中,SC为饱和系数,定义为含有杂质的蔗糖溶液的饱和浓度与
23、纯净蔗糖溶液的饱和浓度的比值,即WSWSSCi/第7章软测量技术Wright于1971年提出了计算过饱和度的模型:WISC1(7-8)其中,=0.088。过饱和度定义为OS=SS-1Wright的模型过于复杂,不适合作为过饱和度的软测量模型。而且在Wright模型中,杂质是一个定值。在这里建模是将白噪声作为干扰,并利用系统辨识的方法进行建模的。第7章软测量技术2)建立糖液过饱和度软测量模型及仿真结果(1)煮糖过程分析。传统的方法是用折光计测量糖液的锤度来间接地反映过饱和系数。由于锤度指的是糖液中固溶物的百分比含量,因此用锤度反映过饱和度,在一定程度上忽略
24、了杂质的影响。在建立软测量模型的时候,可把易测的量即锤度作为二次变量。温度对过饱和度的影响也不容忽视,但因为在数据采集过程中,将温度固定在常规煮糖所用的温度上,所以在此没有将温度考虑进去。另外,粘度、真空度等对过饱和度也有一定的影响。粘度在生产中很难测量,因此,根据软测量选择二次变量的原则,它不适合作为二次变量。第7章软测量技术真空度在煮糖过程中一直保持在常值,并且真空度和温度不能同时控制。分析所有影响过饱和度的因素,锤度影响最大,而且也容易测量。所以在这里应用的是锤度和过饱和度之间的关系。Wright模型在实际中具有一定的可靠性。在Wright模型中,杂质是作为一个定值进行研究的
25、。在这里将白噪声作为干扰,并利用系统辨识的方法进行建模。第7章软测量技术(2)系统辨识方法得出的过饱和度模型。建立过饱和度软测量模型时选用了501组数据,用系统辨识的方法得到过饱和度和锤度的关系如下:9234510)1139.07424.09538.15234.26446.14287.0(xxxxxy(7-9)其中:过饱和系数;x糖液的锤度。y第7章软测量技术(3)仿真结果与分析。用试验数据得到的软测量模型计算出的过饱和度与用Wright模型计算出的过饱和度基准曲线随锤度变化的比较如图7-1所示。图7-2是过饱和系数的相对误差与锤度的关系。过饱和系数的相
26、对误差的计算公式如下:bbwcyyyy(7-10)其中:ywc过饱和系数的相对误差;yb基准曲线的过饱和系数;y估算公式计算的过饱和系数。第7章软测量技术图7-1过饱和度拟合曲线与基准随锤度变化的比较图第7章软测量技术图7-2过饱和系数的相对误差曲线与锤度的关系图第7章软测量技术7.2.27.2.2基于状态估计的软测量方法基于状态估计的软测量方法11状态估计状态估计人们日常生活中经常遇到需要根据某现象推测某种可能和某种情况的时候,根据不同的思维方法和经验,会得到不同的推测结果。用数学语言讲就是基于某种算法和规律,从已知的知识或数据出发,估计出过程的未知结构
29、助变量相对于系统是完全可观的,那么CxyvBuAxxCwCx/(7-12)这种利用状态观测和状态估计的方法,从辅助变量可以得到状态变量的估计值,进而获得主导变量y的估计值y的解决问题的方法,就是基于状态估计的软测量的基本原理。第7章软测量技术假定从时刻1起到时刻k,对辅助变量进行了k次测量,获得的辅助变量为T)()2()1(k(7-13)依据辅助变量,对第j时刻的主导向量y(j)进行估计。通常把所得到的主导向量估计值记为;把估计误差记为,把估计的均方差阵记为;把j=k的情况称为滤波。在一定的最优准则下,对主导向量y(k)进行滤波递推估计就是软测量的Kalman滤波器算法
30、。)/(kjy)/()()/(kjyjykjy)/()/()/(kjxkjxEkjPT第7章软测量技术Kalman滤波器是如何实现软测量对过程状态的估计的呢?假设所讨论的过程的状态方程和观测方程为)(),()1(kwkkxfkx(7-14))()()()(kvkxkGky(7-15)式中:x(k)k时刻的N维状态向量;y(k)k时刻的r维观测向量;v(k)k时刻的r维观测噪声;w(k)k时刻的r维过程噪声;fx(k),kk时刻对系统的控制量;G(k)系统的观测矩阵。对于单测量系统,G(k)为1;对于多测量系统,G(k)为矩阵。第7章软测量技术假设噪
32、)()()1/()()()/(kKkRkKkGkKIkkPkGkKIkkPTT第7章软测量技术预测误差协方差阵:)1()1/1()1/()1/1()1/1(kxfkkPxfkkPkkxTkkx(7-18)式中:(k-1)包括各种误差和过程噪声对协方差带来的影响;I为单位矩阵。Kalman滤波的基本思想就是选取使得估计方差最小的增益矩阵。第7章软测量技术3.3.基于状态估计的软测量在管道煤气控制系统中的应用基于状态估计的软测量在管道煤气控制系统中的应用在煤气运送系统中,管道煤气的气流量和管道的气压力是整个控制系统的关键参数。现以简化的管道煤气运送系统(见图
33、7-5)为例。为了构建该煤气运送系统的控制系统,我们必须获取管道煤气的煤气流量和管道的气压力。但是,管道煤气的流量是一个随着煤气的总流量和管道不同的位置变化而变化的时变量。第7章软测量技术图7-5管道煤气运送系统第7章软测量技术显然,对于各管道中的流量和压力参数,我们只可以测得入口、出口和中间某测量点的参数值,大范围管道处的参数值的准确测量几乎是不可能的,如果一定要测,则代价十分昂贵,并将给工艺设计带来很大的困难。但由于这两种参数对控制系统非常关键,因此希望通过软测量的方法来获取各处管道的这些参数的估计值,并考虑利用状态估计的方法来实现这些参数的软测量估计。为此,我们选择状
34、态变量x=pqT,其中p表示管道煤气的压力,q表示管道煤气的流量。可以得到如下的管道煤气的状态方程:ztzpztzqttzqttzpappaqpapa),(432),(1),(),()()()((7-19)第7章软测量技术也即),(),(),(tzxtzxftzxzt(7-20)另外,令输出点的气压为系统输出:Lztzptyjji0);,()(7-21)根据上式(7-19)、(7-20)、(7-21)表示的系统,根据式(7-16)设计出所需要的状态估计器:)()()(),(),(),(tytyzKtzxtzxftzxzt(7-22)第7章软测量技术图7-6基于
35、观测器的管道参数的软测量系统结构示意图第7章软测量技术图7-7是我们对某管道出口点实际测得的气压值和经过估计器的软测量估计得到的气压值汇成的曲线。通过图7-7可以看到,估计值和实际值非常接近,且估计值跟踪实际值的反应非常迅速,说明基于估计器的软测量具有快速的收敛性能。第7章软测量技术图7-7某管道处的气压估计值与实际值的反应曲线对比第7章软测量技术7.2.3基于模式识别的软测量方法基于模式识别的软测量方法1.统计模式识别统计模式识别1)统计模式识别的基本原理假定根据一定的经验和知识,将需要做出判断分析的对象分成n类,分别记作A1,A2,An;提取对象的m个特征(观察
36、变量),一般为m个随机变量,记为X1,X2,,Xm;X=X1X2XmT组成了被观察对象的一个特征向量。令x=x1x2xmT为被观察对象中的一个样本,它可看做m维空间Rm中的一个点;每一类Ai均可看成空间的一个子空间Rmi,即类型空间。统计模式识别就是根据所选取的多个特征把样本空间Rm划分为n个类型子空间,然后定义一个以特征向量X为自变量的判别函数W(X),根据样本x的判别函数W(x)和一定的判别规则就可判定样本x所属的子空间Rmi,即断定应归为Ai类。第7章软测量技术2)统计模式识别过程统计模式识别的过程大致相同,这里仅就图像识别过程作简要介绍。统计模式识别认为图像可能包含一
37、个或多个物体,并且每个物体属于若干事先定义的类型、范畴或模式类之一。虽然模式识别可以用多种方法实现,但我们只关心用数字图像处理技术对它的实现。在给定一幅含有多个物体的数字图像的条件下,模式识别过程由三个主要阶段组成,如图7-8所示。第7章软测量技术图7-8模式识别的三个阶段第7章软测量技术2.2.模式识别系统的统计模式识别系统的统计(1)物体检测器设计,即选择能够将图像中各个物体分离开的景物分割算法。(2)特征选择,即确定能够最好地辨别物体类型的物体性质以及如何度量这些性质的方法。(3)分类器设计,即建立分类算法的数学基础并选择所使用的分类器的结构类型。(4)
38、分类器训练,即确定分类器中各种可调整的参数(决策界限等),使之适应被分类的物体。(5)性能评估,即估计各种可能的错分类率的预期值。第7章软测量技术3.3.模式识别方法模式识别方法模式识别的方法很多,如判别函数法、最近邻域法、非线性映射法、特征分析法、主因子分析法等。最近邻域法是模式识别中最常用的方法。进行模式识别时,首先要进行特征提取,即从所研究的模式中提取能反映模式最基本情况的特征,并建立标准样本和标准样本库。如果某个模式选定了n个特征,就是说由n个有序的数x1,x2,,xn来描述这个模式,则该n个数构成了一个n维特征矢量。当未知模式与标准样本库中的某一标准样本模式的特
39、征矢量相距最近时,即可认为这一未知模式就是该类标准样本所代表的模式。这就是模式识别中最常用的最近邻域法。第7章软测量技术1)特征提取对金属氧化物半导体气敏元件来讲,其电阻变化与气体浓度的关系可用下式表示:jrjijiijCKRR)(0(7-23)式中:i气敏元件阵列中气敏元件的序号,i=1,2,,n(n=8);j气体种类(模式)的序号,j=1,2,,m;Rij阵列气敏元件i在浓度为Cj的气体j中的电阻值;Ri0阵列气敏元件i在纯净空气中的电阻值;Kij在气体j中呈现的与元件i特性有关的系数;rj与元件j的特性有关的参数。第7章软测量技术为了排除气体浓度
40、的影响,提取判别气体种类的特征,可作如下比值运算数值处理。令niiijiijijRRRRA100(7-24)将式(7-23)代入上式,得niijijnirjijrjijijKKCKCKAjj11)()(7-25)由式(7-25)可见,比值Aij无量纲,它只与气体种类j和器件i本身特性有关,与气体浓度Cij无关,故比值Aij可作为排除气体浓度影响后判别气体种类的特征值。第7章软测量技术2)标准样本库的建立建立标准样本库的具体步骤如下:(1)测试阵列中各元件在纯净空气中的电阻值,得到一个八维数组:8040302010,.,RRRRR(2)在配气箱中发生样气j=1,2,
41、,m,分别测量阵列中每一元件i=1,2,,n(n=8)在每种样气j中的阻值,共得nm个数据:nmnnnmmRRRRRRRRRRRR,.,.,.,32122322211131211第7章软测量技术(3)求取比值Aij(也称归一化处理)。先构成气体(模式)j=1,即样本,则特征矢量的八维数组如下:,1101111ARRA,1202121ARRA,1303131ARRA1404141ARRA,1505151ARRA,1606161ARRA,1707171ARRA1808181ARRA其中:其中:81018081202110111.iiiRRRRRRRRA以此类推,可求出样
42、本,样本,以此类推,可求出样本,样本,若要识别若要识别m中的气体,中的气体,则由则由j=m个样本构成标准样本库。个样本构成标准样本库。第7章软测量技术33)确立未知模式的判别准则确立未知模式的判别准则根据最近邻域法,未知模式的判别式为21812)(miniijixjAAd(7-26)式中:i气敏元件阵列中气敏元件的序号,i=1,2,n(n=8);j气体种类(模式)的序号,j=1,2,m;Aij在标准样本库的样本j中气敏元件i的特征值;Aix气敏元件i在未知气体x中的特征值。第7章软测量技术4)未知气体种类的判别判别未知气体种类的步骤如下:(1)分别测量阵
43、列中每个气敏元件i=1,2,,n(n=8)在未知气体x中的阻值,得到一个八维数组:xxxxxRRRRR84321,.,第7章软测量技术(2)求取未知气体特征矢量的八维数组,即求取Aix(i=1,2,,n(n=8)),得,1011xxxARRA,2022xxxARRAxxxARRA8088其中:810808202101.iiixxxxxRRRRRRRRA(3)求取最小距离,即按式(7-26)计算dj(j=1,2,,m),在d1,d2,dm中数值最小者所代表的气体种类就是未知气体的种类。第7章软测量技术4.4.句法模式识别句法模式识别句法模式识别基于描
44、述模式的结构特征,用形式语言中的规则进行分类。句法模式识别系统通常由四部分组成,如图7-9所示。待识别的输入图像,经过增强、数据压缩等处理后,按识别的具体对象分割成子图(如三角体和长方体),再将子图分割成更简单的模式基元(即组成三角体和长方体的各个面),并判别基元之间的关系。如三角体是由相互邻接的四边形和三角形所组成,而长方体则由三个相互邻接的四边形组成。通过对基元的识别,进而识别子模式,最终识别该复杂物体。第7章软测量技术图图7-9句法模式识别系统框图句法模式识别系统框图第7章软测量技术结构模式识别方法主要包含以下内容:(1)模式基元的选择与抽取。句法识别的首要问题是确
45、定一个模式基元集。基元的选择一般应注意两点:基元应是模式的基本单元,且宜于利用它们之间的结构关系来紧凑而方便地描述模式。基元应是简单的子模式,可用非语言方法(如统计方法、几何尺寸度量等)来提取。目前主要有两种可选择的方法:着眼于图形的边界或骨架的基元选择和按区域划分多边形近似的基元。而基元的抽取方法只能按不同的基元设计不同的方法来进行。第7章软测量技术(2)模式文法。在解决了基元的选择之后,下一步就要建立一种(或几种)文法,以产生一种(或几种)语言,用以描述待识别模式。模式文法主要有串文法、扩展的串文法、阵列文法、树文法、网文法和图文法。第7章软测量技术(3)串的
46、识别与分析。串的识别与分析的主要方法有有限自动机、非确定的下推自动机、导出树、CYK算法、Early算法和转移图法。为了要事先确定一个文法来描述所研究模式的结构信息,同样需要采用模式的训练样本集把文法推断出来。它类似于统计模式识别系统中的“训练”过程。有了推断出来的文法才可对未知类别的字符串进行句法分析,达到分类的目的,但是文法推断现在还远不及统计学习成熟。第7章软测量技术5.5.基于模式识别的软测量基于模式识别的软测量假定我们想实现一个对在传送带上传送的水果进行分类的系统。实际的分类由一个如图7-10所示的活动的挡板来实现,当挡板降下时将各个水果拨出传送带,并分别落入相应的
47、运输箱里。假定待分类的水果是樱桃、苹果、柠檬和葡萄。我们需要一个图像处理系统,它能够观察移动中的水果,对它们进行分类,并能够及时地降下相应的挡板以实现水果的正确装箱。第7章软测量技术图图7-10水果分类系统水果分类系统第7章软测量技术图7-11特征空间第7章软测量技术7.2.47.2.4基于人工神经网络的软测量方法基于人工神经网络的软测量方法1.1.人工神经网络人工神经网络人工神经网络是一种模仿人的大脑神经网络行为特征的分布式并行信息处理算法结构的动力学模型。它用多路输入部件输入信号,并对这些信号按加权求和,当超过一定阈值时输出的部件产生“兴奋”即响应。人工神
48、经网络就是应用这种输入响应过程来模仿动物神经元的工作方式,并通过这些神经元部件相互联接的结构和反映关联强度的权系数使其“集体行为”具有各种复杂的信息处理功能。特别是这种宏观上具有鲁棒、容错、抗干扰、适应性、自学习等灵活而强有力功能的形成不是由于元部件性能不断改进,而是通过复杂的互连关系得以实现的,因而人工神经网络是一种联接机制模型,具有复杂系统的许多重要特征。第7章软测量技术人工神经网络的特点和优越性主要表现在以下三个方面:第一,具有自学习功能。例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功
49、能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测和效益预测,其前途是很远大的。第二,具有联想存储功能。人的大脑是具有联想功能的。如果有人和你提起你幼年的同学张某某,你就会联想起张某某的许多事情。用人工神经网络的反馈网络就可以实现这种联想。第7章软测量技术第三,具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解。神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本单元。据神经生物学家研究的结果表明,一个人
50、的大脑一般有10101011个神经元。每个神经元都由一个细胞体、一个连接其他神经元的轴突和一些向外伸出的其他较短分支树突组成,如图7-12所示。第7章软测量技术图7-12神经系统的基本构造第7章软测量技术人工神经网络就是基于神经系统的基本构造人工神经元,人工神经元模型是生物神经元的抽象和模拟。通常一个神经元可能有多个输入端,但只有一个输出端,一般是多输入单输出的非线性器件。这个输出值是对所有输入值处理后的结果,如图7-13所示。第7章软测量技术图7-13人工神经元模型第7章软测量技术图7-13中,v为vi的矢量集合,vi为神经元的内部状态;i为阈值;xi为
51、输入信号,i=1,2,3,n;w为wji的矢量集合,wji表示从单元j到单元i的连接系数;si为外部输入信号。所以有iijmjjiiSxwv.1(7-27)为了得到理想期望的输出结果,必须对每个神经元的输入值进行特殊地处理加权处理。每个神经元都有不同的加权值,加权处理在实际中有很重要的意义。第7章软测量技术2.2.人工神经网络模型人工神经网络模型人工神经网络是一个并行和分布式的信息处理网络结构,该结构一般由多个神经元组成,每个神经元有一个单一的输出,它可以连接到很多其他的神经元,其输入有多个连接通路,每个连接通路对应一个连接权系数。人工神经网络模型很多,归纳起来大致可分
52、为两类,即前向网络和反馈网络。软测量技术中常用的人工神经网络模型主要是前向网络。第7章软测量技术图7-14多层前向网络第7章软测量技术作为一种常用的人工神经网络,典型的多层前向网络如图7-14所示。它由一个输入层、一个或多个隐含层(也称中间层)和一个输出层构成。相邻层之间的各神经元实现全连接,即下一层的每一个神经元与上一层的每个神经元都实现全连接,而且每层各神经元之间无连接。所谓“隐含层”,即这一层只接收内部输入,并且只产生内部输出。输入层的神经元用于将输入信号分配给隐含层的神经元。每个隐含层的神经元对其输入信号根据相应的连接权值计算加权和,经过阈值限制和激励函数(也称为激活函
53、数或基函数)转换,得到这个隐含层神经元的输出。以第j个隐含层神经元为例,它的输入输出关系由式(7-28)表示:ijijijxwfc)((7-28)第7章软测量技术表表7-1激励函数的主要类型激励函数的主要类型第7章软测量技术3.3.人工神经网络原理人工神经网络原理反向传播(BP)算法是多层前向网络最常用的学习算法。它是一种基于梯度下降的最优化算法,通过调节连接权值,使系统误差函数或其他形式的代价函数极小化。反向传播是指其权值调节的形式。在训练(学习)阶段,输入样本以一定的顺序提供给网络,并逐层地前向传播,直到在输出层计算出网络的输出。目标输出与实际输出进行比较,形成误差
54、项。此时,网络的连接可以被理解为发生了“反向”,误差作为连接反向后的网络输入,逐层地反向传播,所经过的连接,其权值被调整,如图7-15所示。第7章软测量技术图7-15用算法修正一个多层前向网络第7章软测量技术常用的系统误差函数为均方差函数:21)(211pjpjPpytyPE(7-29)其中:ypj(t)和ypj分别为第j个训练样本作用下网络的目标和实际输出;P为训练样本总数。相应的误差评价准则为E(7-30)其中,理论上为无限小,而实际上是反映误差允许度的一个设定值。神经元i到j的连接权值为wji,对其调节量wji作如下定义:ijjixw(7-31)其中:为学习
55、率;j为误差项。第7章软测量技术对于输出层的神经元,有)(jjjjytynetf(7-32)对于隐含层的神经元,有qqqjjjwnetf(7-33)其中,netj为神经元j的输入信号加权和。由此,以迭代的方式,从输出层开始,对各层的神经元计算误差项,并对所有连接确定其权值的调节量。第7章软测量技术4.4.人工神经网络建模方法人工神经网络建模方法1)样本数据(1)收集和整理分组。采用BP神经网络方法建模的首要和前提条件是有足够多典型性好和精度高的样本。而且,为监控训练(学习)过程使之不发生“过拟合”和评价建立的网络模型的性能与泛化能力,必须将收集到的数据随机
56、分成训练样本、检验样本和测试样本三部分。此外,数据分组时还应尽可能考虑样本模式间的平衡。第7章软测量技术(2)输入/输出变量的确定及其数据的预处理。一般地,BP网络的输入变量即为待分析系统的内生变量(影响因子或自变量),一般根据专业知识确定。若输入变量较多,一般可通过主成分分析方法压减输入变量,也可根据剔除某一变量引起的系统误差与原系统误差的比值的大小来压减输入变量。输出变量即为系统待分析的外生变量(系统性能指标或因变量),可以是一个,也可以是多个。一般将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型效果会更好,训练也更方便。第7章软测量技术2)神经网络拓扑结构的
58、。第7章软测量技术(2)隐层节点数。在BP网络中,隐层节点数的选择非常重要,它不仅对建立的神经网络模型的性能影响很大,而且是训练时出现“过拟合”的直接原因,但是目前理论上还没有一种科学而普遍的确定方法。确定隐层节点数的基本原则是:在满足精度要求的前提下选取尽可能紧凑的结构,即取尽可能少的隐层节点数。隐层节点数不仅与输入/输出层的节点数有关,而且与需解决的问题的复杂程度和转换函数的形式以及样本数据的特性等因素有关。第7章软测量技术在确定隐层节点数时必须满足下列条件:隐层节点数必须小于N-1(其中N为训练样本数);否则,网络模型的系统误差与训练样本的特性无关而趋于零,即建立的
60、神经网络的训练(1)训练。BP网络的训练就是通过应用误差反传原理不断调整网络权值,使网络模型输出值与已知的训练样本输出值之间的误差平方和达到最小或小于某一期望值。虽然理论上早已证明具有1个隐层(采用Sigmoid转换函数)的BP网络可实现对任意函数的任意逼近,但遗憾的是,迄今为止还没有构造性结论,即在给定有限个(训练)样本的情况下,如何设计一个合理的BP网络模型并通过向所给的有限个样本的学习(训练)来满意地逼近样本所蕴含的规律(函数关系,不仅仅是使训练样本的误差达到很小)的问题,目前在很大程度上还需要依靠经验。因此,通过训练样本的学习(训练)建立合理的BP神经网络模型的过程,在国外被称