理论教育 最优控制及其研究进展

最优控制及其研究进展

时间:2023-07-01 理论教育 版权反馈
【摘要】:最优解一般总是代表系统工作状态的极值点,所以,有时称其为极值控制系统。一般很难用定量方法求得整体是最优控制的。因此常常是求出许多局部最优控制,再挑选整体最优控制。时至今日,最优控制理论的研究,无论在深度或是广度上,都有了较大的进展。

最优控制及其研究进展

最优控制(Optimal Control)是指,怎样选择控制规律使控制系统的性能和品质在某种意义下为最优。如最小时间控制,最少燃料控制和最佳调节器等。

最优控制已经在航天、航海、导弹电力系统、控制装置、生产设备和生产过程中得到了比较成功的应用,而且在经济系统和社会系统中也得到了广泛的应用。

1.最优控制发展

在第二次世界大战期间及其后的一段时间内,以提高发射命中率为主要目标的伺服(随动)系统理论得到了迅猛的发展。这一理论在设计与分析单输入、单输出的,线性、时不变的集中参数系统时是行之有效的。然而,随着空间技术的发展,控制系统日趋复杂,其精度要求越来越高,这种理论就日益暴露出它的局限性来。因此人们又开始寻找新的理论了。

早在20世纪50年代初期,就发表了从工程观点研究最短时间控制问题的文章,尽管其最优性的证明多半是借助于几何图形,带有启发的性质,但是毕竟为发展现代控制理论提供了第一批实际模型。

由于最优控制问题引人注目的严格表述形式,更因为空间技术的迫切需要,引起了一大批数学家的注意。人们发现,最优控制问题就其本质来说,乃是一个变分学问题。然而,经典的变分理论所能解决的,只是其容许控制属于开集的一类最优控制问题,而实际上遇到更多的,却是其容许控制属于闭集的一类最优控制问题,这就要求人们开辟求解最优控制问题的新途径。

在解决最优控制问题的种种方法中,有两种方法最富有成效,一种是美国学者贝尔曼(Bellman,R.)的“动态规划”;另一种是前苏联学者庞特里雅金的“最大值原理”。

“动态规划”是贝尔曼在1953~1957年间逐步创立的,他依据最优性原理,发展了变分学中的哈密顿-雅可比理论,构成了“动态规划”。

“最大值原理”是庞特里雅金等人在1956~1958年间逐步创立的,他受到力学中哈密顿原理的启发,先是推测出“最大值原理”,随后又提供了一种证明方法,并于1958年在爱丁堡召开的国际数学会议上首次宣读。

最优控制的一个前提是,系统的控制是否存在最优解?系统的最优解是否存在,其判定是比较复杂的。故一般都是先假定有一个最优解,然后去求这个最优解。最优解一般总是代表系统工作状态的极值点,所以,有时称其为极值控制系统。

还应了解,所求得最优应是“整体”最优,而不是局部最优。一般很难用定量方法求得整体是最优控制的。因此常常是求出许多局部最优控制,再挑选整体最优控制。

再就是要了解,怎么去自搜寻最优,并使系统保持在最优点附近的工作。

2.最优控制算法

最优控制关键在自寻最优。所以它的算法主要是怎么实现自寻最优的算法。

PLC模拟量最优控制是基于计算机的控制,是靠程序实现的。其寻求最优的过程不必弄清系统的数学模型,而是靠实际试探。由于当今的PLC已经有很强的运算能力,很大的内存容量及很快的指令执行速度,已完全可以进行这个探索。

最优控制的过程如图3-97所示。

978-7-111-39745-8-Chapter04-173.jpg

图3-97 最优控制过程

可知,自寻最优系统应具有两个基本功能:①实时地不断检测本身的工作状态,不断地对系统是否处于当时可能达到的最优状态做出判断。②根据检测和判断所得的信息迅速地做出使系统趋向最优状态的调整。(www.daowen.com)

实现自寻最优点的方法主要有切换、摄动、自导和模型定向等。

(1)切换法。先让输入信号以恒定速度沿着使系统性能改善的方向变化,直到系统性能不再继续改善时为止。这时系统状态可能已越过最优点,但仍处在最优点附近。然后,再让输入信号以同样速度反向变化,重复同样的调整过程。不断地重复这种调整,就可能使系统的工作状态保持在最优点附近。

输入信号作用方向的变化周期称为搜索周期,自寻最优系统的性能值只能在最优点附近变化而不能严格保持在最优值,这种偏差的平均值称为搜索损失。

较长的搜索周期可使系统具有较强的抗干扰能力,但同时也加大了搜索损失。设计自寻最优系统时,应结合实际情况兼顾各方面的性能要求而选取适当的搜索周期。

(2)摄动法。这种方法是切换法的发展。其基本原理是:在系统的输入量上,附加一个周期性的探测信号(摄动量),例如正弦信号。通过在这个混合输入信号作用下,系统输出信号的分析,可以得到系统输出是否向最优点运动的信息。利用这个信息不断地调整输入量即可使系统向最优点运动。采用这种搜索方式时,可根据噪声特性、系统动态特性和对搜索损失的要求来确定探测信号的幅度和周期,以及是否需要采取移相措施等。

(3)自导法。这种方法不需要其他输入信号。将输出量对时间的一阶导数的实测值,经积分作用后送入系统的输入端,以实现对极值点的搜索。取积分的目的是为了减弱或消除外界或内部随机干扰的影响。只要开始时输出量的变动趋势与寻优方向相符,系统就会自动趋向于最优点。具体设计这种系统时,必须考虑系统的动态特性对最优点的影响。

(3)模型定向法。基本思路是建立一个能描述最优运动状态的数学模型(系统的最优点可由此模型确定),再根据这个模型用一定的算法找出所需的输入。为建立这个模型,可以先向系统输入一个试验信号,然后根据系统的输出数据用参数估计方法确定模型的各个参数。模型定向法需要较多的数值计算,用于在线控制时需要使用快速计算机。

具体的程序可分块实现。这些程序块有:效果评定程序模块,试探计划程序模块,试探执行程序模块,方案确定程序模块等。具体程序略。

时至今日,最优控制理论的研究,无论在深度或是广度上,都有了较大的进展。然而,随着人们对客观世界认识的不断深化,又提出了一系列有待解决的新问题。可以毫不夸张地说,最优控制理论依旧是极其活跃的科学领域之一,也是PLC实现模拟量控制的重要方面。

3.最优控制应用

最优控制理论问题较为深奥,但PLC模拟量用的最优控制却没那么复杂。只是有这么几种情况:

在控制算法确定后,怎样选定控制参数,使控制效果最佳。如使用PID控制时,其控制参数自行整定,也可说成这里的最优控制。而且是自寻最优控制的。再如,在比例控制中,比例系数选定,也有个怎么选择,以实现最优的问题。

在控制结构确定之后,一般都有多种控制算法,如用PID,或只用PD,而不用I,也可能用模糊控制算法等。怎样在其中自动选定一个最优的算法。

控制结构,即用哪些控制量,通过哪些环节实施对系统的控制,如有多种方案可选定,那也可设计相关的最优控制算法,以确保被控制量的变化或系统的投入、产出获得最佳。

实施这些最优算法,关键要处理好两个问题:

1)“优”的评价。什么叫“优”?要有标准。

2)可选用方案的设计。根据经验,一般讲,最优方案总是在可预料的范围内出现。即实际的系统,最优可选变量定义域总是有边界的。这样,即可在这个定义域内设计可能的方案。

有了这两条,再加上相应搜索程序。实现最优控制是可能的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈