1 引言
在刚性机械臂系统中,存在着诸如机械臂自身参数误差、 观测噪声、 未建模动态及不确定性的外界干扰等因素. 针对刚性机械臂系统中的模型不确定性部分进行逼近的自适应神经网络控制和自适应模糊控制的研究已经引起研究者的广泛关注. 文[1]引入滤波跟踪误差,设计了自适应神经网络控制器,实现网络权值的在线调整,保证了闭环系统中的所有信号最终一致有界. 文[2]针对未知机械臂系统,通过神经网络和线性观测器相结合的方法,设计了自适应跟踪控制器,该方法取得了较好的控制效果. 文[3]采用滑模控制和神经网络相结合,并使用模糊监督控制器,虽然提高了控制系统的性能,但是还需获取系统的先验知识和附加一些限制条件的约束. 文[4]针对水下机器人设计了自适应神经网络跟踪控制方法,证明了在存在神经网络逼近误差和外部扰动的情况下,水下机器人控制系统的跟踪误差一致稳定有界. 文[5]针对n自由度机器人系统设计了动态结构模糊神经网络鲁棒自适应控制器,附加的滑模鲁棒项有效地减小了建模误差,并采用投影算子保证了动态参数的有界性. 文[6]针对系统参数完全未知且仅输出可测的刚性臂机器人,采用RBF神经网络和高增益观测器设计了一种自适应神经控制算法,实现了沿周期跟踪轨迹对未知闭环系统动态的确定学习,改进了控制系统的性能. 文[7]针对模型不确定的机器人系统设计了基于高斯RBF静态神经控制器的稳定自适应跟踪控制算法,静态神经网络控制器在开关逻辑的监督下完成控制,完整的控制方案可以看作是一个2阶段控制器,基于调制信号的监督Agent能确保轨迹运行在正常范围区域内,这种结构能起到克服多维系统中的“维数灾难”问题. 文[8]针对驱动系统动态的机器人,提出了由PD(proporational-derivative)控制器、 前馈补偿器和RBF神经网络补偿器组成的控制算法,该算法不依赖于机器人系统精确动力学模型,仅需要系统的输入输出数据,既保留了PD控制器的优势,又提高了控制系统的跟踪性能. 在上述文[1, 2, 3, 4, 5, 6, 7, 8]中,RBF神经网络用于逼近机械臂系统的不确定部分,采用李亚普诺夫综合法设计参数的在线自适应调节律,用以保证控制系统的闭环稳定性,但是在网络结构与参数的确定上,以往的方法往往利用先验知识确定,有时会影响闭环系统的跟踪精度和控制效果,存在一定的不足. 文[9]针对具有模型不确定的机械臂系统,提出了增广回声状态网络(A-ESN)控制算法,虽然该方法取得了较好的控制效果,但是A-ESN网络的输出权值需要预先训练,不具有一定的实时性.
极限学习机(ELM)是由Huang[10]等提出的用于SLFN的快速学习算法. 该算法的特点是随机选择SLFN的隐层节点及节点参数,学习过程中只调节网络的输出权值,因此,与采用梯度下降算法调整所有网络权值参数的SLFN相比,ELM提高了SLFN的推广性,具有极快的学习速度. 文[11]针对单输入单输出(SISO)仿射非线性系统,提出了基于ELM的直接自适应神经控制算法.
鉴于ELM的优点,本文针对刚性机械臂系统,提出基于ELM的自适应神经控制算法,采用李亚普诺夫稳定性理论证明在系统存在外界干扰和逼近误差的条件下,设计的ELM自适应控制器能保证闭环系统的稳定性. 将ELM控制器应用于2自由度平面刚性机械臂系统,在同等条件下,与RBF自适应控制器进行比较,以验证本文控制算法的有效性.
2 极限学习机2.1 具有随机隐层节点的SLFN
对于含有L个隐层节点的SLFN的输出函数,可以描述为
其中,wi、 bi为网络隐层节点的学习参数; βi为连接第i个隐层节点与网络输出层节点的输出权值向量; ki(x)为第i个隐层节点的输出函数K(x; wi,bi),K(x; wi,bi)由隐层节点类型确定,若隐层节点为可加性节点,其激活函数为若隐层节点为RBF类型节点,其激活函数为
2.2 ELM的学习理论对于任意给定的N组数据(xi,ti)∈Rn×Rm,xi=[xi1,xi2,…,xin]T,ti=[ti1,ti2,…,tim]T,含有L个隐层节点的SLFN的函数模型为
并且SLFN能以零误差逼近训练样本,即∑Nj=1oj-tj=0,则存在βi、 wi、 bi,使: 以矩阵形式表示为 其中, 其中,H为SLFN的隐层输出矩阵,矩阵H的第i列表示与输入x1,x2,…,xN相关的第i个隐层节点的输出向量. 矩阵H的第i行表示与输入xi相关的隐层特征映射,即xi∶h(xi)隐层特征映射定义为h(x)=[K(x; w1,b1),…,K(x; wL,bL)].如果激活函数k在任意区间上无限可微且SLFN隐层节点及节点参数可以随机生成,存在下面的定理:
定理1[12, 13] 给定任意小的正数ε(ε>0),任意区间上无限可微的激活函数k∶R→R,和N组任意给定的不同训练样本,在以概率1收敛的任意连续概率分布下,存在L≤N,对于在Rn×R的任意区间上随机生成的SLFN隐层节点参数{(wi,bi)}Li=1,有HN×LBL×m-TN×m<ε成立.
从插值的思想看,隐层节点的最大数目L应当小于训练样本的数目N,事实上,当L=N时,训练误差将为0. 由定理1,当L
当激活函数K(xj; wi,bi)在任意区间上无限可微时,且随机指定SLFN的隐层节点参数wi和bi,则训练时无需调整,这样式(7)成为线性系统. 对SLFN的训练学习相当于求解线性方程组HB=T的最小二乘解B,即:
式(8)中,权值最小范数的最小二乘解为 其中H†为矩阵H的Moore-Penrose广义逆. 3 ELM的自适应跟踪控制 3.1 机械臂动力学模型及其结构特性
考虑一个n关节的刚性机械臂,其动力学方程为
其中,分别为机械臂关节位置、 速度、 加速度向量; M(q)∈Rn×n为正定对称惯性矩阵;为离心与哥氏力矩阵; G(q)∈Rn为重力向量;为摩擦力; τd∈Rn为未知外加干扰; τ∈Rn为关节控制输入.机械臂系统的动力学特性如下:
特性1 惯性矩阵M(q)是正定对称矩阵且有界,I为单位矩阵,存在正数m1、 m2满足不等式m1I≤M(q)≤m2I.
特性2 是一个斜对称矩阵,即对任意向量x∈Rn,有
特性3 存在未知干扰为正实数.
3.2 针对ELM网络整体逼近的控制器设计跟踪误差定义为
其中qd(t)∈Rn为期望轨迹. 滤波跟踪误差可定义为 其中为设计矩阵,则可得系统闭环滤波跟踪误差动力学方程为 其中且:在实际工程中,模型不确定项f(x)未知,需要对不确定项f(x)进行逼近. 因此,采用单输出ELM网络分别对不确定项f(x)的每个元素fi(x)进行逼近,式(6)中的矩阵B∈RL×m此时成为L×1的列向量; 而针对输入x,式(6)中的矩阵H∈RN×L此时成为行向量h(x)∈R1×L. 因此用于逼近fi(x)的ELM网络具体可表达为
其中表示ELM网络输出权值向量,hi(x)∈R1×L表示ELM网络隐层输出向量.假定属于紧集Ωi,定义如下:
其中βMi为设计参数,L为ELM网络隐层节点的个数.定义ELM网络最优输出权值向量β*i为
其中D表示x的有界紧集,则权值估计误差为 ELM逼近误差定义为 假定紧集D足够大,保证对所有x∈D,最小逼近误差有界,即其中εN为未知常量,i=1,…,n. 根据上述分析,有: 采用逼近函数代替f(x),结合式(14)可设计控制律为 其中Kv=diag{kv1,kv2,…,kvn}(k<sub>vi>0)为控制增益矩阵.进一步,为了减少对模型的逼近误差,可引入鲁棒控制项τr. 因此,下面考虑在机械臂的期望轨迹
Rn光滑有界的情况下,ELM网络权值自适应律和鲁棒项τr的设计. 3.2.1 τr为符号函数的自适应律设计
定理2 考虑式(10)的机械臂系统,若设计具有鲁棒性的控制律为
其中, 且ELM网络的权值自适应律为 其中γi>0为自适应律因子,则控制律式(17)可保证闭环系统所有信号一致最终有界且轨迹跟踪误差及其导数渐近收敛于0,即当t→∞时,证明 将控制律式(17)代入式(13)可得
选择李亚普诺夫函数为 对式(21)微分,并将式(20)代入得 根据特性2可得: 其中考虑自适应律式(19)在不同情形的取值:
若,则
若则由于,可得出:
又因为,所以因此,无论自适应律取何种形式,均能保证:
由式(18),若: 则有:由式(22)及Kv的正定性可得r∈Ln2. 因此,由文[14]可知,e∈Ln2∩∈Ln∞,e是连续的,且当t→∞时,e→0, 由式(22)可得到0≤V(t)≤V(0),t≥0,即V(t)为非递增且有界. 因此,当V(t)∈L∞时,有,即闭环系统所有信号都最终一致有界.
3.2.2 τr为饱和函数的自适应律设计定理3 考虑式(10)的机械臂系统,若设计具有鲁棒性的控制律为
其中饱和函数设计参数γ>0. 当γ→0时,sat(y)近似于阶跃函数,即在y=0-时,sat(y)等于-1; 当y=0时,sat(y)等于1. sat(y)是一个连续函数. 式(24)中,向量sat(r)的各个分量满足sat(y)的定义.
若ELM网络的逼近误差ε的上界ε
ELM网络的权值自适应律取式(19),控制律式(23)可保证闭环系统所有信号一致最终有界,轨迹跟踪误差及其导数渐近收敛于0的一个很小的邻域内,即当t→∞时,
证明 类似于定理2的分析,有:
由于:
考虑式(24),式(26)满足:
其中,则有: 以向量形式表示为 vec(yi)表示列向量,其元素为yi∈R.因此,由式(26)和式(27)可得:
将式(25)代入上式,可得: 因为r∈Rn的分量ri=γ时,rie-ri /γ有最大值γ/e,则上式可表示为 其中α1(·)依赖于ρ(r)的系数,也是关于的连续函数.定义紧集Ωr为
其中λmin(Kv)表示矩阵Kv的最小特征值. 由此可得,在紧集Ωr之外,是严格负定的,即如果存在limt→∞V(t)=V(∞),则信号有界,从而有界. 此外,由式(28)可知,参数bd、 α0、 α1决定跟踪误差的e精度,即参数bd、 α0、 α1的值越小,跟踪误差e越小; 同时随着控制增益kvi增大,跟踪误差e及其导数保持在0的一个很小的邻域内,即存在t→∞时, 4 仿真研究为了验证所设计的ELM自适应控制方法的有效性,选择2自由度平面刚性机械臂为被控对象进行仿真实验,并与RBF网络自适应控制算法在同等条件下进行比较. 机械臂的动力学模型为方程(10),其各参数为[15]
其中,q1和q2分别为关节1和关节2的角度,和分别为关节1和关节2的角速度,m1和m2分别为连杆1和连杆2的质量,l1和l2分别为连杆1和连杆2的长度,g为重力加速度. 在仿真中摩擦力为,,外界干扰为期望轨迹为qd(t)=[qd1(t),qd2(t)]T=[sint,cost]T. 机械臂动力学方程中的参数为l1=l2=1.0 m,m1=0.8 kg,m2=2.3 kg,g=9.8 m/s2. 系统的初始状态选择为
仿真中,ELM网络的隐含层节点个数L=30,ELM网络输出权值自适应律取式(19),控制律取式(23),鲁棒项取式(24). ELM网络的隐层节点激活函数选取为K(x; w,b)=1/(1+exp(-(w·x+b))),隐层节点参数(w,b)在[-1, 1]和[0, 1]之间分别随机选择. 为了验证所设计控制器对外界扰动的抑制能力,在t=3.0 s时κ的值从0变到1.
设计参数选择为Λ=diag{20,20},控制增益矩阵Kv=diag{100,100},εN=0.10,bd=0.20,γi=50,βMi=0.5,i=1,2,采样时间T=0.001 s. 仿真结果如图 1~图 4所示.
从图 1中可以看出,当机械臂系统存在模型不确定性和未知外界干扰时,提出的ELM自适应神经控制算法可以成功驱动仿真系统的输出收敛到期望轨迹附近很小的邻域内,达到了预期的跟踪效果.
从图 2可看出,采用饱和函数代替符号函数可以使ELM控制器的控制输入信号在整个控制过程中处于平滑有界状态而没有高频抖振现象发生. 从区部放大图可看出,在t=3.0 s时加入具有随机特性的外界扰动信号后,ELM自适应控制器的控制输入信号处于平滑状态而没有出现扰动现象,说明了本文所设计控制器具有很强的抗外界干扰能力. 从图 3可以看出,采用ELM网络设计的自适应控制算法与RBF神经网络自适应控制算法相比,位置跟踪误差渐近收敛于零的一个很小的邻域内的速度更快,且误差所在的邻域更小,从而提高了控制精度. 图 4表明了ELM网络输出权值是有界收敛的. 这些仿真结果证实了所提控制器的良好跟踪性能及对不确定机械臂系统进行跟踪控制的有效性.
5 结论针对具有模型不确定性的刚性机械臂系统,采用基于ELM的SLFN对机械臂系统中的未知不确定函数进行逼近,基于李亚普诺夫稳定性理论设计ELM网络权值的自适应调节律,提出了基于ELM的自适应神经控制算法,在系统存在未知外界干扰和逼近误差条件下,均能保证闭环系统的稳定性及滤波跟踪误差的最终一致有界. 此外,分段设计的ELM网络权值自适应律具有投影算子的特性,保证了权值有界. 通过应用于2自由度刚性机械臂的实例验证了ELM控制器的有效性和鲁棒性.
[1] | Lewis F L, Liu K, Yesildirek A. Neural net robot controller with guaranteed tracking performance[J]. IEEE Transactions on Neural Networks, 1995, 6(3): 703-715. |
[2] | Sun F, Sun Z, Woo P Y. Neural network-based adaptive controller design of robotic manipulators with an observer[J]. IEEE Transactions on Neural Networks, 2001, 12(1): 54-67. |
[3] | Hu H, Woo P Y. Fuzzy supervisory sliding-mode and neural-network control for robotic manipulators[J]. IEEE Transactions on Industrial Electronics, 2006, 53(3): 929-940. |
[4] | 俞建成, 李强, 张艾群, 等. 水下机器人的神经网络自适应控制[J]. 控制理论及应用, 2008, 25(1): 9-13. Yu J C, Li Q, Zhang A Q, et al. Neural network adaptive control for underwater vehicles[J]. Control Theory and Applications, 2008, 25(1): 9-13. |
[5] | Chen C S. Dynamic structure neural-fuzzy networks for robust adaptive control of robot manipulators[J]. IEEE Transactions on Industrial Electronics, 2008, 55(9): 3402-3414. |
[6] | 吴玉香, 杨梅, 王聪. 从机器人输出反馈自适应神经网络控制中学习[J]. 控制与决策, 2012, 27(11): 1740-1745. Wu Y X, Yang M, Wang C. Learning from output feedback adaptive neural control of robot[J]. Control and Decision, 2012, 27(11): 1740-1745. |
[7] | Mulero-Martinez J I. Robust GRBF static neurocontroller with switch logic for control of robot manipulators[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(7): 1053-1064. |
[8] | 王良勇, 杨枭. 带有前馈和神经网络补偿的机械手系统轨迹跟踪控制[J]. 电机与控制学报, 2013, 17(8): 1-6. Wang L Y, Yang X. Trajectory tracking control for robotic manipulators endowed with feedforward and neural networks[J]. Electric Machines and Control, 2013, 17(8): 1-6. |
[9] | 杜佩君, 张瑞锋. 基于增广ESN的机器人轨迹跟踪控制[J]. 信息与控制, 2013, 42(4): 443-448. Du P J, Zhang R F. Trajectory tracking control for robots based on Augmented ESN[J]. Information and Control, 2013, 42(4): 443-448. |
[10] | Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: A new learning scheme of feedforward neural networks[C]//Proceedings of 2004 IEEE International Joint Conference on Neural Networks. Piscataway, NJ, USA: IEEE, 2004: 985-990. |
[11] | Rong H J, Zhao G S. Direct adaptive neural control of nonlinear systems with extreme learning machine[J]. Neural Computing and Applications, 2013, 22(3/4): 577-586. |
[12] | Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1): 489-501. |
[13] | Huang G B, Wang D H, Lan Y. Extreme learning machines: A survey[J]. International Journal of Machine Learning and Cybernetics, 2011, 2(2): 107-122. |
[14] | Desoer C A, Vidyasagar M. Feedback systems: Input-output properties[M]. Burlington, MA, USA: Academic Press, 2009. |
[15] | Lewis F L, Abdallah C T, Dawson D M. Control of robot manipulators[M]. New York, NJ, USA: Macmillan Publishing Company, 1993. |