理论教育 基于鲁棒右互质分解和PI控制的IPMC鲁棒跟踪控制优化方案

基于鲁棒右互质分解和PI控制的IPMC鲁棒跟踪控制优化方案

更新时间:2025-01-03 理论教育 版权反馈
【摘要】:目前,对IPMC研究的热点集中在对其末端位移偏移量或者弯曲角度上的控制。现代鲁棒控制根据算法的精确性去设计控制器,其设计的目标是能够找到在实际情况下保证安全性能的最小满足要求。基于微分几何学的非线性系统控制理论的诞生,促进了非线性鲁棒控制理论的研究。其中非线性鲁棒控制中的基本问题就是镇定问题。鲁棒控制领域目前所研究的主要问题就是分析研究系统在不确定性因素下或者外加扰动下的控制系统性能的变化,包括动态性

智能材料(Smart Material)是指能够对外部刺激进行自感知、自适应、自修复的新型功能材料,具有类似生物质能的特性。随着科技时代的发展,智能材料俨然成为新型高科技材料发展的中坚力量。目前广泛研究的智能材料有压电陶瓷,形状记忆合金,高分子聚合材料以及磁致伸缩材料。其中离子聚合物金属材料(IMPC:Ionic-exchange Polymer Metal Compos-ite)是一种离子型电致动聚合物,由于其可以任意切割形状和规模,轻质,柔韧性好,可以自由运动操作,性能与生物肌肉类似,已经被人们给予人工肌肉的美名[31,32]。IPMC的应用与发展给人们带来了希望,用人工肌肉材料作为执行器,可以减轻重量,避免繁琐的复杂结构,不再需要传统机械中用到的轴承齿轮等,在传感器、医用高分子材料、仿生机器人应用等方面得到广泛发展[33,34]。目前,对IPMC研究的热点集中在对其末端位移偏移量或者弯曲角度上的控制。

对IPMC人工肌肉偏移位置控制的研究大致分为两大类,一类是将非线性模型近似成为线性的物理模型去控制,另一类是直接从非线性本质特征出发去研究控制非线性物理模型。黑箱法及灰箱法大多应用于线性模型的研究,而白箱法通常用来研究非线性模型。对于近似得到的线性模型而言,对其进行精确位置控制,常用的方法有PID(Proportional Integral and Derivative),LQR(Linear Quadratic Regulator),模糊控制等,但是IMPC在动态运行过程中往往表现出一些非线性行为,是一种高度复杂非线性对象,因此,从非线性本质特征去考虑,如何获得其非线性数学模型及其控制策略,使得能够对其位置进行精确控制显得至关重要。

众所周知,在实际存在的客观现实世界里,绝对的线性对象是不存在的,它们都以非线性形式客观存在。因此,研究非线性系统的本质特征才是最切实的。非线性一般表现在两个方面:一是系统的固有属性,二是实际系统的不完善性。它们之间的本质区别就在于线性系统不再满足线性叠加定理,这使得分析非线性系统要比线性系统困难得多。非线性系统不仅包括线性系统存在的衰减振荡、发散振荡、临界振荡等,还包括振荡环,甚至引起混沌现象。从数学的角度出发,非线性系统往往求解起来比较困难或难以获得满意的解析,从而失去真实意义[7]。与普通的控制系统研究一样,非线性系统的研究也围绕两个问题:系统的分析问题和综合问题,这就涉及对控制系统性精度的要求以及控制器的设计问题。我们一般研究的控制系统为名义模型,没有考虑控制过程中存在的不确定因素。而实际系统难免存在着不确定因素,如工作状况的变动、元件老化、建模过程中产生的误差以及外部扰动等,实际真实理想的精确模型难以得到,而系统的各种故障也会致使模型的不确定性。因此,模型的不确定性广泛存在于实际的控制系统中。尽管发展成熟的基于能控和能观思想的现代控制理论,以其反馈镇定的理论为后续的理论研究发展奠定了基础,但是却严重依赖控制系统的被控对象的精确数学模型。但是实际系统处在不断运行变化过程中,这种变化不可能精确得知,况且实际系统的建模往往要做一些近似处理,这就使真实系统与得到的数学模型之间存在一定的误差,如降阶处理、参数的定常处理等。正是由于这些差别的存在,使得现代控制理论在处理某些实际工程方面显得捉襟见肘。那么怎么设计一个固定的控制器,使得带有不确定性因素的对象在受到某些参数扰动影响下,依旧能够维持一定性能的特性,也就是通常所说的鲁棒控制

一般被控对象的不确定性大概分为两大类:一是结构不确定性,二是非结构不确定性。结构不确性包括参数不确定性以及未建模动态两部分;非结构不确定性包括外部扰动、时滞、磁滞、噪声等引起的不确定性。其中时滞是过程普遍存在的固有属性[8],因为任何系统的物质能量传输都是一个过程,都需要时间,当系统参数做出变动时,被控量需要一点时间才会开始改变。磁滞现象就是指由于磁性体的磁化存在着不可逆性,当磁铁被磁化到饱和状态后,如果将磁场强度由最大值逐步减小,其磁感应强度不是按照原来的轨迹返回,而是沿着比原来的轨迹稍高的一段路线而减小。

对于含有不确定性系统而言,研究的方法通常无外乎两种,一种就是主动适应参数变化带来的影响,如自适应控制;另一种就是被动控制,即鲁棒控制。对于带有不确定性因素的非线性鲁棒控制问题,从20世纪50年代初就一直是控制界关注和研究的热点。在鲁棒控制发展的初期,研究的不确定性主要针对单变量系统(SISO)的微小扰动[35],具有代表性的则是Zames提出的微分灵敏度分析。但是实际系统中外部因素引起的参数变化并不是无限小扰动而是有界扰动。因此诞生了现代鲁棒控制,它的研究领域是在有界参数扰动下的鲁棒稳定。现代鲁棒控制根据算法的精确性去设计控制器,其设计的目标是能够找到在实际情况下保证安全性能的最小满足要求。

基于微分几何学的非线性系统控制理论的诞生,促进了非线性鲁棒控制理论的研究。其中非线性鲁棒控制中的基本问题就是镇定问题。在20世纪80~90年代,Lyapunov函数渐渐进入到非线性控制领域中,在设计鲁棒镇定系统的时候,假设存在于实际系统中不确定性是未知的,但属于某一个可描述的集合,即不确定性因素可以描述为有界的未知参数、增益有界的未知摄动函数或未知动态过程。然后根据有界性和被控对象的标称模型来构造一个Lya-punov函数用以确保整个系统中不确定性集合中的每一元素都是稳定的。在发展Lyapunov方法的同时,学者们一直也在探寻其他的非线性鲁棒控制方法。20世纪90年代非线性控制理论研究热点则是H∞控制,它是指通过一定性能指标的无穷范数优化而获取带有鲁棒性能的控制器。而非线性系统的鲁棒H∞控制问题于1989年由Ball和Helton引入提出。

近年来随着智能控制方法的不断研究与发展,非线性鲁棒控制智能方法有鲁棒自适应控制,鲁棒右互质分解,滑模变结构控制等。鲁棒控制领域目前所研究的主要问题就是分析研究系统在不确定性因素下或者外加扰动下的控制系统性能的变化,包括动态性能和稳定性能分析以及如何去应对这些变化带来的影响等,去考虑分析设计应该如何设计控制器,使得系统具有更强的鲁棒性能及抗干扰能力。而IPMC人工肌肉是一种非线性程度比较高的对象,而且控制性能容易受参数变化及各种扰动的影响。因此,在对IPMC人工肌肉位置控制设计时必须考虑到各种不确定性以及外部扰动并采取合适的策略对其精确的偏移位置进行控制。对含有不确定性因素的IPMC人工肌肉智能材料进行研究,如何采用合适的控制算法使得在不确定下能够精确位置控制具有很好的现实意义。

3.3.1 IPMC人工肌肉位置控制模型

人工肌肉大致分为电致动人工肌肉EAP(Electroactive Polymer)和气动人工肌肉(Pneu-matic Artificial Muscles),EAP按照致动原理分为离子传导人工肌肉和电子传导人工肌肉[32]。电子型电致动聚合物是在电场的作用下依靠内部电子的迁移来驱动,但是激励所需要的电场比较大。它主要包括压电效应材料,液晶弹晶体以及电致动伸缩材料。而离子型电致动聚合物是由内部离子扩散造成渗透压形成的形状变化,它主要包括离子聚合物胶体、导电聚合物以及离子金属交换材料IPMC。IPMC(图3-7)人工肌肉材料内部具有固定带电网链,阳离子可以通过网链进行扩散和迁移。它的驱动电压比较低,一般1~3V就可以驱动。

图3-7 IPMC人工肌肉

IPMC作为一种新型智能材料,与其他智能材料相比,它具有体积小、质量轻、无污染、寿命长、响应速度快、驱动电压低、能够产生较大的位移、形变以及微型化发展等优点。表3-1[36]列出了IPMC、压电陶瓷以及形状记忆合金的一些性能比较,不同材料具有不同性能,可以看出IPMC的形变量要大得多。

表3-1 三种智能材料的属性对比

为了研究IPMC的电致动特性,需要对其内部的驱动原理进行系统建模[3]。目前,研究IPMC人工肌肉有三种不同的模型方法,即黑箱法,灰箱法,白箱法。其中黑箱模型是内部规律完全不清楚,只用实验辨识方法,根据经验采用相关数学方法去等效得到其内部规律。灰箱则是只清楚部分内部规律,结合实验数据,采用实验辨识得到内部规律不完整的系统模型。而对于内部机理和属性清楚的系统,即所谓的白箱,利用材料力学、电学以及物理学等。根据已知得到的某些规律,经过分析推导出系统的模型,大多数工程系统均为此类模型。白箱模型的优点则在于其内部的物理规律非常清晰,缺点在于演算相当繁琐,传递函数很难得到,系统模型的求解一般数值解。灰箱模型掌握部分内部规律,比较容易得到模型解析解,传递函数易求解。但是不能完全表征事物的内在本质规律。黑箱法有利于系统模型的建立,容易求得传递函数和模型解析解,但脱离了事物的内在本质规律,一般通过近似和简化为灰箱来处理。IPMC人工肌肉动态运行过程中表现出是高度复杂非线性,其驱动模型机极其复杂。驱动过程涉及电场、力场、化学场、流场等耦合作用的结果。目前,国际上的学者对IPMC的研究涉及以上三种模型。

(1)黑箱模型:根据IPMC人工肌肉材料的位移响应性能,Kanno[32]等人于1994年提出一种简单的输出位移和输入电压之间的传递函数,通过选取电压幅值作用到对象,测量得到不同的激励响应,并将检测到的末端位移偏移量通过采用最小二乘法拟合得到一个时间指数函数表达式,最终得到其电压激励下的传递函数表达式。这种模型只依据系统输入与输出关系构造模型,不考虑内部结构的变化过程,模型结构相对简单,对实验数据依赖性较强,因此模型通用性较差。

(2)灰箱模型:通过对黑箱模型的改进,Kanno于1996年[3]提出了一种二维的线性灰箱模型,将IPMC人工肌肉材料的内部电场激励部分等效为一种电路模型,通过相关电学及物理方法计算得到其电压激励下的内部电流值,假设内力张量与电流呈线性关系,根据得到的张力通过力场分析从而确定材料的最终形变。该模型依然是通过实验测量而不是通过真正物理模型得到内部变化规律,但是电路模型推导与应力分析是基于物理规律,因而是一种灰箱模型。

(3)白箱模型:2000年,Tadokoro等人认为在外电场激励下,其内部的水合阳离子从阳极运动到阴极,导致阳极区收缩,阴极区膨胀,从而引起IPMC薄膜弯曲变形[32]。形变程度取决于膜内体积的变化、膜内水合阳离子的转移,阳离子和水分子的扩散以及粘性阻力等综合因素。依据内部运动关系,根据动量守恒定律推导出IPMC材料内阳离子的运动和力平衡方程,最后求出电场强度与末端位移形变之间的关系。

根据三种不同的机理模型,对IPMC人工肌肉进行了控制。Liwei Shi等[38]学者根据IPMC的内部运行机理,推导出等效的电路线性模型,采用经典PID对其控制,实现了水下IPMC人工肌肉执行器的运动控制。王瑷珲等[3,36,37]学者采用基于演算子理论的鲁棒右边互质分解方法对IPMC的位置进行控制,通过对对象进行分解并设计控制器,实现了鲁棒稳定及跟踪控制。孔维健[39]采用逆补偿控制实现了对线性IPMC模型的位置跟踪。国内的研究大部分还处在对IPMC的性能研究上,对闭环控制的IPMC位置控制应用还不是很多。

IPMC的动态模型可以分为线性模型和非线性模型。线性模型不具有或部分具有系统的先验知识,而非线性模型则具有完备的系统知识,一种IPMC的非线性动态模型可以描述为[41]

式中:v是状态变量;u是控制输入电压;y是控制输出曲率;Rc是电极电阻;Ra是限流电阻;Ye是等效模量;Ke介电常数;h是IPMC人工肌肉的厚度;Δ是有界未知的不确定量;函数Γ(v)、C1(v)与Ca(v)是状态变量和一些参数的函数表达式。其中Γ(v)表达式可以表述为:

a、b的值由以下公式得到:

式中:R是气体常数;F是法拉第常数;C-1负离子浓度;T是绝对温度。L、W、h分别代表IPMC的长度、宽度和厚度。S=WL,代表IPMC的截面积。函数C1(v)与Ca(v)的表达式分别为:

式中:k1与k2电化学表面过程中的化学速率常数;q1是常数,CH+是氢离子H+的浓度。

式中:Y1、Y2与Y3是多项式的系数。

3.3.2 含有不确定性的非线性控制模型

上述的动态模型具有详细的物理机理知识,是一个精确的数学模型。但在实际应用中,很难精确识别一些物理参数,再者模型中的一些参数对实际系统应用中的影响甚小。因此,有必要对模型进行一些处理,得到一个含有不确定性的非线性动态模型。一般意义下,式(3-22)中的ΔV是足够小的一个量,C-是一个有界常量,因此|C-ΔV|→0,式(3-22)中的参数a、b的值可以近似得到:a≈。因为IPMC可以工作在干燥或者潮湿的环境中,本书研究工作是在干燥的环境下进行研究的,因此CH+→0,所以Ca(v)≈0。在式(3-24)中,Y1、Y2与Y3足够小,|Y(v)|≪|v|,Ra与Rc是有界的常量。因此在式(3-20)中,Y(v)可以忽略,将其等效为模型误差。通过实验测量得到的参数T、L、W、h、Ra、Rc等也会产生测量误差,因此非线性模型建立为:

式中:Δ为不确定性,包括参数测量误差以及模型误差。将式(3-21)~式(3-24)代入式(3-25)中可得到如下非线性模型:

定义一个新的变量x=av,上述非线性模型可表述为:

3.3.3 鲁棒非线性PI跟踪控制器设计

根据鲁棒稳定和跟踪条件,对象右互质分解和控制器设计为:

为了保证人工肌肉(IPMC)安全和更长时间的工作,以及过程输入u(t)受下面它的大小的约束。

umax=3V,umin=-3V分别是保证IPMC安全的最大工作电压和最小工作电压。我们可以设计算子A和B来满足下面这个巴拿赫方程:

式中:算子A1稳定的;B是可逆的。为此对于带有约束输入的人工肌肉(IPMC)控制系统这种情况,我们假设:

B(u)(t)=au(t)

(3-31)

根据鲁棒稳定条件:

如图3-1所示设计的跟踪控制器C表示:

3.3.4 基于粒子群跟踪控制器参数优化

粒子群优化算法(Particle Swarm Optimization,PSO)又翻译为粒子群算法、微粒群算法或微粒群优化算法。是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。通常认为它是群集智能(Swarm Intelligence,SI)的一种。它可以被纳入多主体优化系统(Multiagent Optimization System,MAOS)。粒子群优化算法是由Eberhart博士和Kennedy博士发明[40,41]

我们通过粒子群优化自动寻优得到滑模控制器的三个参数的最佳组合匹配,满足了系统的鲁棒稳定,进而使用PI跟踪控制器对其进行跟踪,接下来通过粒子群自动寻优,包括跟踪控制器参数在内的五参数组合,如何找到这之间的最佳组合呢?下面对其进行了验证,适应度函数选为分别对阶跃以及正弦信号进行跟踪控制,如图3-8~图3-13所示,从图中可以看出,粒子群优化出来的参数带入跟踪控制器能够达到跟踪目的。但对于五维问题,粒子初始范围是随机的,随机产生的粒子的某一维数并不是真实有效的,尽管能够满足粒子群优化跟踪控制器和滑模控制器参数的要求,但是需要对某一维做一些限制,才可以避免超调,缩短调节时间等。

用粒子群优化五个参数,从仿真效果看,五参数的匹配问题比三参数的匹配来的困难,对某一维度要做一些限制,性能要求的也要求的比较多,如系统超调,调节时间,振荡等。所以用粒子群可以优化鲁棒稳定的滑模控制器的参数和跟踪控制器参数,但是由于粒子群初始化位置对优化效果有一定影响,Kp、Ki参数的整定需要用经验法大致确定范围加以限制才能避免超调、振荡等,所以对于跟踪控制器,尝试采用神经网络自动调整权值的方法去调节控制器的输出,而把滑模控制系统等效为一个稳定的对象。

3.3.5 基于神经网络的PI跟踪控制系统设计

多层前向BP(Back propagation)网络,又名“误差反向传播神经网络”,它是由Werbos于1974年提出来的,是目前应用最广泛的一种神经网络形式,通常由输入层、隐含层、输出层构成。它的学习规则采用的是最速下降法,学习过程包括正向传播与反向传播。在正向传播过程中,隐含层单元处理来自输入层的消息,并将处理后的结果传入输出层,如果输出层的输出没有达到目标值,则转入反向传播;在反响传播过程中,会逐个修改各层之间神经元的权值。

图3-8 阶跃信号下五参数优化后的控制器输入与输出

图3-9 阶跃信号下五参数变化曲线

图3-10 五参数优化下适应度曲线

图3-11 正弦信号下五参数优化下适应度曲线

图3-12 正弦信号下五参数变化曲线

图3-13 正弦信号下五参数优化下适应度曲线(www.daowen.com)

(1)BP算法实现步骤包括:初始化;输入训练值并计算每层输出;计算网络输出误差;计算各层误差信号;调整各层权值;判断误差是否满足精度要求;满足则结束,否则继续计算每层输出。

(2)BP算法的限制:

①训练时间长。对于一些特殊问题求解,BP神经网络的时间训练有可能需要几个小时来完成,这主要归结于学习速率太小。对于这种问题,可以采用自适应的学习速率改进。

②完全不能训练。BP神经网络的初始权值的选取具有随机性,如果在训练时,由于权值调整过大以至于激活函数趋于饱和,那么网络权值的调整基本上就会停滞。所以在初始化权值的时候,一般选取介于[-1,1]较小的初始权值。

③容易陷入局部极小值。因为BP算法采用的是最速下降法,又名“梯度法”,网络的训练是从随机初始化的一点开始,依照误差函数斜面收敛。因此,不同的起点则可能导致不同的极小值产生,甚至找不到最优解。如果训练未达到精度要求,通常增加网络层数或者增加神经元个数来弥补,但是这样会使得网络的复杂性和训练时间增加。

(3)BP算法改进:

①对学习率的改进。一般来说,较小的学习速率容易确保训练的收敛,但是如果学习速率太慢,训练时间就会增加;较大的学习速率能够在一定程度上加快收敛,但可能会致使训练结果振荡或者发散,因此提出了自适应调节学习率的方法:

②选取合理的初始权值。前面介绍初始权值一般选为较小值,以免初始权值在调整过程中超出,导致收敛滞停。但是,初始权值的选取不同,导致最后的收敛结果也会有所不同。因此,初始值的确定决定了网络收敛方向,初始权值的合理选取就会显得意义重大。一般处理的方法都是初始化的时候给网络设置多个初始权值,然后根据训练效果来确定选取其中最好的那一个。此外,采用模拟退火方法也有助于跳出局部极小值。该方法是由Kirkatrick于1983年提出的一种进化算法,该算法的提出主要就是为了解决易陷入局部极小值问题。

③附加动量法。标准BP算法在权值调整时,仅依据t时刻误差的梯度方向进行调整,忽略了t时刻之前的方向信息,从而使得在训练的时候发生振荡,造成收敛速度下降,为了避免这种情况,可以在权值调整过程中附加动量。附加动量法实质就是把利用动量因子来传递最后一次权值的变化量。

④改变网络结构。一般根据实际求解问题来确定网络输入与输出层节点数,其中最重要的是隐含层单元的信息确定。如果隐含层单元太少,网络学习过程可能不收敛,模型的选取对问题的处理不会准确,隐含层单元太多,虽然能够提高映能力,但会造成网络体系过于复杂,性能降低。目前对于隐含层信息的确定经常通过实验来比对效果或者通过已有的经验去确定。

(4)基本BP算法包含两个方面:信号的正向传播和误差的反向传播。正向传播过程中通过网络的拓扑结构根据网络输入经过权值调整输出,反向传播过程是根据误差准则函数,采用最速下降法,进行反方向权值修正,使得经权值调整过的网络输出接近目标值。如图3-14所示,输入层j,隐含层i,输出层l。x(m)表示输入层第m个节点的输入,网络输入层的输入为:

式中:上角标(1)与下面公式中提到的上角标(2)、(3)分别代表输入层、隐含层、输出层;wij表达的意思是隐含层第i个节点单元到输入层第j个节点单元之间的权值,wli是输出层第l个节点单元到隐含层第i个节点单元之间的权值,f(x)表示隐含层的激励函数,表示输出层的激励函数,网络隐含层单元的激励函数f,输出层单元的Sigmoid函数分别去为f(x),g(x),如公式(3-36)、式(3-37)所示。

图3-14 三层BP神经网络结构示意图

①信号的前向传播过程:

网络隐含层的输入则为:

网络隐含层的输出为:

网络输出层的输入为:

网络输出层的输出为:

②误差的反向传播过程:

误差准则函数取为:

采用梯度法,对网络进行修正,如公式(3-43)所示:

式中:按照E(k)的负梯度方向调节并加上一个惯性项,α为惯性常数,η为学习速率。

而u(k)=u(k-1)+kp[e(k)-e(k-1)]+kie(k),那么:

分析求解权值变化关系式有:

可以由符号函数sgn代替,由此产生的误差通过学习速率来调整,得出网络输出层的权系数学习算法:

用类似的处理过程可得隐含层与输入层之间权值的学习规律:

(5)上面介绍了BP神经网络应用在PI跟踪控制器的算法推导,在设计网络拓扑结构的时候需要对以下几个问题考虑分析。

①网络的层数。Robert Hecht Nielson已经证明由一个隐含层的BP神经网络可以用来逼近任何有理函数。在设计网络层次的时候,一般取个三层就可以完成从N维到M维的映射,扩充网络层数在一定范围内可以减小误差,增强性能,但同时也会使得网络结构过于复杂化,并且导致权值的训练调整时间增加。事实上,可以通过增加隐含层的神经元个数来降低系统训练的误差,这样在训练的同时有利于调整,根据训练的结果可以更方便地进行神经元数目的调整。所以在设计网络结构的时候,首先考虑增加隐含层的神经元个数去提高系统训练的精度。

②隐含层的神经元数。前面提到在提高网络训练精度方面优先增加隐含层个数,那么隐含层的神经元到底取多少个?首先评价一个网络设计的性能是优良还是恶劣,主要看它最后的收敛精度和训练所需时间的长短。一般取的隐含层神经元数目越多,收敛性能就会越好,但并不绝对,有可能会带来其他问题。通过实验测试,当神经元个数取3、4、5时,训练的精度都差不多,一般神经元的个数依照问题求解的复杂程度而定。

③初值权值的选取。非线性系统不同于线性系统的一点就是它对于初值的选取特别敏感,初始权值的选择影响着收敛精度、学习速度以及训练时间,再者初始权值过大,会导致算法不收敛,所以初始权值一般取在[-1,1]内的较小的数,并且应将这些初始值设为随机数,可以以防权值的调整方向同向。初始权值的选择对整个控制系统的设计及控制效果在非线性系统控制应用中有着关键性的作用。

④学习速率。由权值调整表达式可知,学习速率的大小影响决定着每次循环调整过程中的权值变化量。学习速率过大或过小对系统都会带来不好的影响,太大虽然收敛速度加快,但是容易发生振荡,造成系统不稳定,而学习速率太小,则会导致训练时间过长,收敛变慢。通常学习速率范围选为0.01~0.8,也可以采用自适应学习调整学习速率。

(6)基于BP(Back Propagation)神经网络的PI控制系统要取得好的跟踪控制效果,就需要对kp、ki进行调整[62],它们之间的关系不再是简单的“线性组合”,而是从变化多端的无数组非线性排列组合中找出最佳的组合关系,以往的方法是采取经验试凑法,而BP神经网络拥有强大的非线性映射能力,并且网络结构与学习算法相对简单。通过训练与学习自身网络就能够得到性能指标下最优的PI控制器的参数。基于BP神经网络的PI跟踪控制系统如图3-15所示。控制器由三部分组成:PI控制器,对等效的控制系统进行跟踪控制,参数kp、ki在线调整;PI神经网络,根据系统当前的运行状态,通过权值的调整自动调节PI控制器的参数,以达到某种目标函数下的最优解;滑模控制下等效的系统对象。基于BP神经网络的PI控制跟踪控制器算法如下:

图3-15 基于BP神经网络的跟踪控制系统框图

①选择BP网络的结构,确定输入层、隐含层、输出层节点数,初始化权值Δwli(k)和Δwij(k),确定学习速率η和惯性常数α。

②确定采样时间并得到r(k)和y(k),计算e(k)=r(k)-y(k)。

③选择确定输入和输出。

④根据推导计算每层神经元的输入与输出。

⑤计算得到PI控制器的控制输出u(k),进行控制系统的计算。

⑥根据梯度下降法更新权值Δwli(k)和Δwij(k)。

⑦达到精度,结束,否则返回步骤(2)。

这里采用4×5×2网络,即输入层4层,隐含层5层,输出层2层,学习速率η=0.2,惯性常数α=0.05,输入层Oj=[r(k),y(k),e(k),1],输出层Ol=(kp,ki),阶跃跟踪下初始权值wi和wo分别取式(3-51)、式(3-52),正弦信号跟踪下初始权值wi和wo分为式(3-53)、式(3-54)。

3.3.6 系统仿真结果分析

应用所提方法,对控制系统进行跟踪控制,图3-16、图3-17分别对阶跃信号以及正弦信号进行跟踪,仿真结果表明系统能够很好地跟踪给定,但初始时刻有一定超调,可能是初始权值随机化产生的问题。

图3-16 阶跃信号下跟踪控制输入与输出

图3-17

图3-17 正弦信号下跟踪控制输入与输出

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈