一种新型自学习控制器及其应用.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种新型自学习控制器及其应用 摘要:本文提出了一种新的学习控制律,论证了控制律的合理性,证明了其收敛性,说明此控制律具有控制精度高,收敛速度快等优点,具有广阔的应用前景。 关键词:学习控制 收敛性 压力控制器1 前言   气动控制技术是70年代随着工业自动化的需要发展起来的一门新型控制技术。因其具有节能、无污染、结构简单、高效以及适应恶劣的工作环境等特点,在机器人、飞行器、风洞中尾撑机构以及冶金设备上得到广泛的应用。自Arimoto于1984年提出迭代学习控制以来[1][2],已在很多领域得到充分应用,它仅需较少的先验知识和计算量就可以处理不确定程度相当高的线性或非线性系统,而气动控制系统中广泛存在着参数漂移、非线性特性等,使我们无法得到精确的数学模型,用传统的控制方法很难得到令人满意的效果。因此我们把自学习控制方法引入气动控制系统,提出了一种变学习因子迭代自学习控制算法,并对它的合理性及收敛性进行分析和证明。并把它应用于压力跟踪控制系统,收到了很好的效果。 2 基本描述   考虑如下线性系统的微分状态方程为: (1) 对于非线性系统: 可以在各个工作点附近线性化成式(1)的形式,我们可以用许多局部的线性方程组合起来,以体 现系统全局的非线性。   取控制律为如下形式: (2) 式中:uj(t),uj+1(t)分别是第j次学习,第j+1次学习的控制量;kj1(t)表示k1在t时刻,第j次迭代时的增益值;kj2(t)表示k2在t时刻,第j次迭代时的增益值;ej(t)表示第j次学习时的响应误差,   合并式(1)、式(2)得: (3)   假设系统是能控的,即: 则(4)   式中:B(t)+,C(t)+分别表示矩阵B(t),矩阵C(t)的广义逆矩阵。下一步迭代学习,即j+1次时,控制量将等于理想控制输入ud(t),所以系统输出Yj+1(t)也将等于期望输出Yd(t),系统收敛。这表明采用形式如式(2)的控制律,如取学习增益阵k1,k2为式(4)所示,则正好得到系统的逆系统。系统的动力学特性已包含在k1(t),k2(t)中,即学习算法已经“学会”了系统的特性,理论上讲,以后无论初始偏差ed(t),(t)有多大,下面只需一步学习就可达到期望输出。   学习控制的优点就是无需知道系统的先验知识,但在式(4)中要知道A,B,C阵的值。我们可用最小二乘法借助系统辨识的思想来完成求解k1(t)k2(t)的任务。最小二乘法求 k1,k2的值的形式:   由迭代最小二乘法得增益阵k(i,j)的估计为: (5)   式(5)所表示的参数估计有以下特点:   (1)它不同于一般的最小方差参数估计,虽然形式上是相似的。式(5)的估计是沿学习轴迭代进行的,而不是通常的时间轴。所以可以不象自校正算法那样实时在线求解估计值,而是在两次学习的间隔上离线地运算。正因为这种特点,较为复杂的递推最小二乘法的运算时间,对控制效果没有影响。算法可以推广到运算速度较慢的微机上实现,而且在这种学习算法的基础上可以发展更为复杂的算法;   (2)设计者无需知道系统的结构知识,迭代学习的过程其实就是求解系统逆系统的过程,即已知yd(t),t∈〔0,T〕的情况下,求出ud(t),t∈〔0,T〕的过程;   (3)学习控制器不仅可以学习某一种设定的轨迹yd(t),因为学习因子k1(i,j),k2(i,j)中包含着设定轨迹yd(t)的逆动力学系统的信息,所以可以在此基础上较快地学习另一种相似的设定轨迹yd1(t),这样就表现为某种类似人类的“智能”;   (4)由于某些系统没有全局逆,只能求出对某一设定轨迹的局部逆,所以在学习另一种轨迹时,不会马上完全跟踪重合。但对于有全局逆的线性定常系统,学习因子估计值收敛后,将得到系统的真实逆系统,学习另一种设定轨迹yd1(t)时yd(t)将一步收敛到设定值yd(t)。 3 控制算法的收敛性分析   首先定义几种范数:   其中:e(i)(t)是e(t)∈Rm的第i个元素;g(i,j)是G∈Rm×m的第(i,j)个元素;λ>0。   假设:   (1)系统每次迭代的初始误差为0,即ej(0)=0,(j=1,2,3…)这里j代表学习次数。这个条件很容易满足,如压力控制器每次学习前,把气放完,使压力为零;   (2)k1(t),k2(t),t∈〔0,T〕经迭代估计后都收敛到某些常值。用系统辨识的知识可以证明,满足某些条件,k1(t),k2(t)可以依概率收敛到它们的真值,所以这个假设是合理的。   定理:由式(3)决定的系统收敛(Yj(t)→Yd(t),t∈〔0,T〕)如果满足以上(1)、(2)假设,且‖I-CBK‖∞<1,如果k1(t)=-B+AC+,k2(t)=(CB)+则达到最快收敛速度。   证明:由式(3)得: (6) (7) 将(7)

您可能关注的文档

文档评论(0)

LF20190802 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档