文章快速检索  
  高级检索
改进的量子行为粒子群优化算法及其应用
肖红, 李盼池    
东北石油大学计算机与信息技术学院,黑龙江 大庆 163318
摘要:为提高量子行为粒子群算法的优化能力,提出了一种改进的算法.该算法也采用量子势阱作为寻优机制,但提出了新的势阱中心建立方法.在每步迭代中,首先计算粒子适应度,然后取前K个适应度最好的粒子作为候选集.采用轮盘赌策略在候选集中选择一个粒子作为势阱中心,调整其它粒子向势阱中心移动.在优化过程中,通过使K值单调下降,获得探索与开发的平衡.将提出的算法应用于标准函数极值优化和量子衍生神经网络权值优化,实验结果表明提出算法的优化能力比原算法确有明显提高.
关键词量子计算     粒子群优化     轮盘赌策略     算法设计    
Improved Quantum-behaved Particle Swarm Optimization Algorithm and Its Application
XIAO Hong, LI Panchi     
School of Computer and Information Technology, Northeast Petroleum University, Daqing 163318, China
Abstract:To enhance the performance of quantum-behaved particle swarm optimization, we propose an improved algorithm that uses quantum potential as well as an optimization mechanism and establishes the center of the potential well. In each iteration, we first calculate the fitness of each particle and then take the first K particles with the greatest fitness as the candidate set. We use a roulette strategy to select a particle from the candidate set as the center of the potential well and move other particles toward the center of the well. During optimization, the K value is monotonically decreased to achieve a balance between exploration and exploitation. We apply the proposed approach in the extremum optimization of benchmark functions and weight optimization of a quantum-inspired neural network. Experimental results demonstrate that the optimization ability of the proposed algorithm is quite competitive with that of the original algorithm.
quantum computing     particle swarm optimization     roulette strategy     algorithm design    
1 引言

优化技术是一种以数学为基础,用于求解各种工程问题最优解或满意解的应用技术. 智能优化算法是一种新兴的优化算法,是最受关注的优化研究领域之一,已成为优化计算的重要研究方向. 量子智能优化算法可分为量子衍生优化和量子行为优化算法. 就量子行为优化算法而言,目前国际上最为流行的是我国学者孙俊提出的量子行为粒子群优化(quantum-behaved particle swarm optimization,QPSO)算法[1]. 该算法的基本原理是通过模拟量子力学中粒子在势场中向势能最低点的移动建立搜索机制,即将粒子寻优空间看作量子力学中的势阱,将全局最优解看作势场中势能最低点(势阱中心),将粒子的寻优过程看作势场中粒子向势能最低点的移动过程.

目前国内外学者对QPSO开展的改进研究主要集中于控制参数设计、 算法自身改进与其它算法融合3个方面. 在控制参数设计方面,文[2]通过严格的理论证明得出该收缩因子必须小于1.781才能保证算法收敛. 文[3]提出了基于种群多样性的收缩因子自适应设计方法. 在算法自身改进方面,文[4]运用概率度量空间理论,首次对QPSO的收敛行为给出了深入系统的分析. 文[5, 6, 7]采用高斯分布产生的随机数代替原算法中均匀分布产生的随机数. 文[8]提出了在QPSO中增加局部搜索的新方法. 在与其它算法融合方面,文[9]结合遗传算法的精英保留策略和模拟退火算法容易跳出局部最优的能力,提出了一种改进算法. 文[10, 11]提出了基于差分变异的QPSO算法. 文[12, 13]提出了在QPSO算法中利用混沌序列来产生变异的进化策略.

尽管QPSO目前已有很多改进,然而根据没有最好只有更好的原则,该算法仍有改进的余地和必要. 在QPSO中,势阱中心代表着寻优方向,起着优化路标的作用,本文提出了新的势阱中心设计方法; 同时,本文也提出了一个新的粒子位置更新式. 实验结果验证了新算法的优势.

2 量子行为粒子群算法

根据量子力学原理,粒子动态行为可用如下薛定谔方程描述[14]

其中ħ为普朗克常数,m为粒子质量,V(r)为势场能量分布函数,波函数ψ(r,t)为未知量.

下面以Delta势阱为例说明QPSO的构造过程. Delta势阱的势能分布为V(r)=-γδ(r),代入式(1),可解出粒子的波函数为

其中L2/()为特征长度. 粒子在势阱中r处的概率密度函数为Q(r)=ψ(r)2=e-2|r|/L/L. 为使r处的粒子以较大概率向势阱中心靠近,Q(r)需满足:
由式(3)得,特征长度L=r/(gln($\sqrt 2 $)),其中g>1.

势阱中粒子的行为服从薛定谔方程,在任意时刻的位置是不确定的,而普通粒子服从牛顿力学,在任意时刻必须具有确定的位置. 这一矛盾可采用蒙特卡洛方法解决. 首先在(0,1)内取随机数u,然后令u=e-2|r|/L,最后解出|r|=ln(u-1)L/2. 由此可得

rk=xk-P
α=1/(2gln$\sqrt 2 $),得
式(6)即为QPSO的迭代方程.

3 改进的量子行为粒子群算法

本文提出的改进的量子行为粒子群优化(improved QPSO,IQPSO),其改进措施主要是针对势阱中心的设计进行的. 现有的QPSO采用如下迭代式[15]

式中,pidL为第i个粒子自身最优位置PiL的第d维,cdM个粒子自身最优位置iPL算术平均值C的第d维,即:

这种迭代的不足在于: 在优化的后期阶段作为优化路标的势阱中心的引领作用不够明显.

本文提出的改进措施,其基本思想可描述为: 在每步迭代中,作为势阱中心的粒子,都来源于一个当代构造的最优解候选集,在该集合中采用轮盘赌随机选取.

最优解候选集根据当代种群适应度择优选取前Kbest个粒子构成. 众所周知,在算法初期,重点在于全局探索,而在算法后期,重点在于局部开发. 因此,为平衡算法的探索和开发能力,候选集中粒子的数目Kbest随迭代步数单调减小. 具体如式(9)所示:

式中,popsize为种群规模,max_N为限定步数,t为当前步数.

另外,为增强种群多样性,使算法避免早熟收敛,本文基于当代种群所有粒子的平均值(中心粒子)设计了一个新的位置更新式. 该式的作用为: 使粒子等概率地向着中心粒子或偏离中心粒子移动.

记第t代用轮盘赌选择的粒子为Xbest(t),种群平均粒子为Xmean(t)=$\frac{1}{{popsize}}\sum\limits_{i = 1}^{popsize} {} $Xi(t),本文采用随机选择如下两式之一更新粒子位置:

关于以上两式的合理性,给出如下解释: (1)在根据势阱理论得到的迭代式(6)中,只需将势阱中心P替换为最优粒子xbestd即可得到式(10),在势阱中,粒子向着势阱中心移动,而模拟此现象的式(10),使粒子向着最优粒子移动,因此式(10)是合理的. (2)在式(11)中,α前面的正负号等概率地随机选取,该式的作用效果可表述为式(12):

在迭代过程中,若单纯使用式(10),则很容易导致早熟收敛. 由于式(10)和式(11)等概率随机选取,两式中的正负号也等概率随机选取,因此式(11)的独特之处在于允许粒子以1/4的概率偏离平均粒子,从而能够在一定程度上抑制早熟收敛. 因此式(11)是合理的.

由式(9)~(11)可知,在本文提出的IQPSO中,除了种群规模、 变量维数、 迭代步数等所有智能优化算法都需要事先设定的共性参数外,体现算法自身特性的控制参数,并没有增加,仍然只有一个α.

值得指出IQPSO与现有QPSO[8]有两点不同:

(1) 在IQPSO中,每步迭代用作势阱中心的粒子来自于由前Kbest个适应度最大粒子组成的候选集,具体采用哪个粒子由轮盘赌策略决定; 而QPSO自始至终分别采用自身最优粒子和自身最优粒子的算术平均作为势阱中心.

(2) 关于粒子位置的更新,IQPSO除采用由量子势阱建模得到的更新式外,还采用了另一个类似的更新式,每步迭代,两个公式等概率随机选择使用.

本文提出的IQPSO的算法流程可简述如下:

(1) 种群及参数初始化.

(2) 计算个体适应度.

(3) 按式(9)更新Kbest,建立最优解候选集.

(4) 采用轮盘赌策略在候选集中选择一个粒子作为势阱中心.

(5) 在式(10)和式(11)中,等概率选择其一,产生下一代个体.

(6) 重复步骤(2)~(5)直到满足终止条件.

4 在函数极值优化中的应用 4.1 测试函数

采用CEC2013定义的28个标准函数作为优化对象[16],如表 1所示. 其中,函数名称后面的“(S)”表示该函数的变量是可分离的,“(N)”表示变量是不可分离的. 函数21~28名称后面的n表示该函数由其它n个基本函数复合而成. D为优化空间维数. 所有函数均为极小值优化.

表 1 28个CEC 2013测试函数简介 Tab. 1 Summary of the 28 CEC 2013 test functions
序号名称最小值
单峰函数 1Sphere (S)-1 400
2Rotated High Conditioned Elliptic (N)-1 300
3Rotated Bent Cigar (N)-1 200
4Rotated Discus (N)-1 100
5Different Powers (S)-1 000
基本多峰函数 6Rotated Rosenbrock′s (N)-900
7Rotated Schaffers F7 (N)-800
8Rotated Ackley′s (N)-700
9Rotated Weierstrass (N)-600
10Rotated Griewank′s (N)-500
11Rastrigin′s (S)-400
12Rotated Rastrigin′s (N)-300
13Non-Continuous Rotated Rastrigin′s (N)-200
14Schwefel′s (N)-100
15Rastrigin′s Schwefel′s (N)100
16Rotated Katsuura (N)200
17Lunacek Bi_Rastrigin (S)300
18Rotated Lunacek Bi_Rastrigin (N)400
19Expanded Griewank′s plus Rosenbrock′s (N)500
20Expanded Scaffer′s F6 (N)600
复合函数21Composition Function 1 (n=5,Rotated) (N)700
22Composition Function 2 (n=3,Unrotated)(S)800
23Composition Function 3 (n=3,Rotated) (N)900
24Composition Function 4 (n=3,Rotated) (N)1 000
25Composition Function 5 (n=3,Rotated) (N)1 100
26Composition Function 6 (n=5,Rotated) (N)1 200
27Composition Function 7 (n=5,Rotated) (N)1 300
28Composition Function 8 (n=5,Rotated) (N)1 400
搜索范围: [-100,100]D
4.2 参数设置

为体现提出算法的优良性能,所有函数的优化结果将与文[15]中的量子行为粒子群算法(QPSO)对比,同时也与引力搜索算法(gravitational search algorithm,GSA)和差分进化算法(differential evolution,DE)对比. 引力搜索算法是2009年提出的一种源于对物理学中的万有引力进行模拟的新的优化搜索技术[17],它优于许多现有的智能优化算法,因此可作为测试本文算法性能的参照物.

为保证对比客观公正,IQPSO、 QPSO、 GSA、 DE采用相同的种群规模和迭代步数(即函数评估次数). 为尽量消除对比结果的随机性并增强对比结果的可信度,所有函数均取D=10维和D=30维两种情况,且每个函数均用4种算法各自独立优化30次,取30次优化的平均结果作为对比指标.

4种算法的共性参数设置如下: 当D=10时,种群规模取30; 当D=30时,种群规模取50,终止条件为限定迭代步数,两种维数下的迭代步数均取1 000.

对于IQPSO的个性参数经过多次实验,当D=10时,取α=0.4; 当D=30时,取α=0.3. GSA的个性参数有两个,经过多次实验,万有引力常数G的初值取G0=100,G单调下降的指数因子取α=10; QPSO的控制参数取α=0.5. DE的缩放因子F=0.5,交叉概率CR=0.8.

4.3 优化结果对比

所有实验均在配置Intel(R) Core(TM) i5-3470 CPU 3.20 GHz处理器、 4.00 GB内存、 Window 7操作系统的计算机上,采用Matlab 7.0编程实现. 当D=10和D=30时,IQPSO与QPSO的优化结果对比如表 2所示,IQPSO和GSA的优化结果对比如表 3所示. IQPSO和DE的优化结果对比如表 4所示. 表中粗体表示对比结果获胜.

表 2 IQPSO和QPSO的优化结果对比 Tab. 2 The comparison of optimization results between IQPSO and QPSO
序号D=10D=30
IQPSOQPSOIQPSOQPSO
1-1 400-1 400-1 400-1 399.99
21.289E+62.336E+61.286E+73.471E+7
32.272E+69.853E+75.019E+78.699E+9
43.445E+41.008E+41.192E+55.671E+4
5-1 000-1 000-1 000-999.910
6-887.677-881.479-850.223-804.190
7-798.826-764.098-791.202-699.493
8-678.875-679.572-678.608-678.968
9-596.532-593.335-585.435-563.867
10-499.148-498.655-495.840-484.218
11-393.234-387.112-379.736-240.425
12-290.995-271.720-233.630-64.566 9
13-175.726-168.709-112.45246.018 91
1415.040 35971.510 6469.649 76 635.491
15757.249 51 418.1866 206.5067 537.068
16204.992 1201.379 0206.935 2202.988 8
17317.964 5331.484 7357.369 6520.570 2
18482.609 7440.269 5688.390 2658.776 6
19501.064 1501.831 9503.668 2516.610 4
20604.265 3603.436 9614.972 1614.779 8
211 073.5011 100.1991 031.1821 062.422
22959.052 62 161.3691 328.1777 825.982
231 604.9932 582.6055 872.2289 139.212
241 207.5991 186.1781 224.665 41 251.876
251 305.2891 308.3231 364.422 21 401.211
261 392.9711 361.4731 526.175 31 409.171
271 658.5751 700.1311 866.358 12 310.194
281 7001 945.2881 700.001 31 877.659

表 3 IQPSO和GSA的优化结果对比 Tab. 3 The comparison of optimization results between IQPSO and GSA
序号D=10D=30
IQPSOGSAIQPSOGSA
1-1 400-1 400-1 400-1 400
21.289E+61.084E+61.286E+77.501E+6
32.272E+65.278E+75.019E+75.886E+9
43.445E+41.931E+41.192E+57.034E+4
5-1 000-1 000-1 000-999.997
6-887.677-886.419-850.223-838.203
7-798.826-777.634-791.202-727.061
8-678.875-678.857-678.608-678.636
9-596.532-596.242-585.435-565.943
10-499.148-499.993-495.840-499.857
11-393.234-377.381-379.736-67.189 3
12-290.995-279.470-233.63094.859 60
13-175.726-161.715-112.452346.629 9
1415.040 35765.634469.649 73 983.880
15757.249 5592.721 36 206.5063 855.685
16204.992 1200.013 3206.935 2200.011 7
17317.964 5314.885357.369 6411.101 2
18482.609 7415.709 5688.390 2502.584 4
19501.064 1501.161 2503.668 2513.043 8
20604.265 3604.769 4614.972 1615.000 0
211 073.5011 100.1931 031.1821 057.418
22959.052 62 565.5001 328.1777 144.644
231 604.9932 218.4285 872.2286 819.483
241 207.5991 217.5861 224.665 41 378.301
251 305.2891 313.3401 364.422 21 498.952
261 392.9711 567.5261 526.175 31 564.604
271 658.5751 700.0001 866.358 12 298.096
281 7002 026.5631 700.001 35 304.414

表 4 IQPSO和DE的优化结果对比 Tab. 4 The comparison of optimization results between IQPSO and DE
序号D=10D=30
IQPSODEIQPSODE
1-1 400-1 400-1 400-1 360.54
21.289E+61 281.2261.286E+71.981E+6
32.272E+61 199.5825.019E+71.591E+9
43.445E+4-859.1921.192E+512 544.49
5-1 000-999.999-1 000-875.731
6-887.677-883.220-850.223-766.068
7-798.826-798.671-791.202-751.271
8-678.875-679.607-678.608-678.993
9-596.532-596.370-585.435-571.621
10-499.148-126.906-495.8402 070.522
11-393.234-335.991-379.736-32.718 8
12-290.995-262.673-233.63010.221 97
13-175.726-145.015-112.452178.707 3
1415.040 35384.613 0469.649 72 912.755
15757.249 5594.665 16 206.5063 442.421
16204.992 1200.939 1206.935 2202.664 9
17317.964 5328.180 7357.369 6582.008 0
18482.609 7435.885 1688.390 2690.200 7
19501.064 1920.074 6503.668 253 154.54
20604.265 3602.459 4614.972 1614.990 1
211 073.5011 136.8761 031.1822 291.273
22959.052 61 675.5141 328.1774 876.853
231 604.9931 593.6785 872.2286 351.067
241 207.5991 238.1401 224.665 41 380.327
251 305.2891 333.4631 364.422 21 469.512
261 392.9711 734.1881 526.175 31 569.196
271 658.5751 773.3311 866.358 12 520.549
281 7002 097.8381 700.001 34 568.310

表 2可知,就平均优化结果而言,28个测试函数中,当D=10时,IQPSO优于QPSO的有19个,劣于QPSO的有7个,等于普通QPSO的有2个; 当D=30时,IQPSO优于QPSO的增到22个,劣于QPSO的仅有6个. 这表明,IQPSO不仅明显优于QPSO,而且随着维数增加,其优势趋于增大.

表 3可知,当D=10时,IQPSO优于GSA的有19个,劣于GSA的有7个,等于GSA的有2个; 当D=30时,IQPSO优于GSA的增到20个,劣于GSA的仍为7个,等于GSA的减为1个. 这同样表明,IQPSO不仅明显优于GSA,而且随着维数增加,IQPSO的优势也趋于增大.

表 4可知,当D=10时,IQPSO优于DE的有18个,劣于DE的有9个,等于DE的有1个; 当D=30时,IQPSO优于DE的增到20个,劣于GSA的减为7个,等于GSA的仍为1个. 这同样表明,IQPSO不仅明显优于DE,而且随着维数增加,IQPSO的优势同样趋于增大.

为进一步考察提出策略的性能,表 5给出了IQPSO和DE在维数D=30时的优化误差对比. 其中,“误差”是指优化结束之后得到的目标值与精确目标值的绝对偏差,而“误差中位值、 误差平均值、 误差标准差”均指30次独立优化得到的30个误差的中位值、 平均值、 标准差.

表 5 IQPSO和DE的误差对比 Tab. 5 The comparison of error between IQPSO and DE
序号误差中位值误差平均值误差方差
IQPSODEIQPSODEIQPSODE
10.000 019.4620.000 039.4510.000 040.969
29.1E+61.8E+61.0E+71.9E+65.6E+69.5E+5
32.3E+71.5E+93.9E+71.5E+95.1E+71.1E+9
41.2E+51.1E+41.2E+51.3E+43.6E+47 383.6
51.4E-6101.372.9E-6124.263.6E-689.528
639.492129.3044.180133.9326.06535.413
77.285 846.8267.964 748.7284.626 821.236
821.37721.01221.38021.0060.067 20.057 8
913.69828.10213.98428.3782.927 42.191 9
103.526 72 567.63.583 22 570.51.718 27.348 2
1120.894360.7219.600367.284.616 349.177
1263.180301.9368.322310.2215.76033.041
1383.956370.0085.145378.7035.15140.107
14498.762 906.8581.683 012.7320.81660.12
155 455.12 983.45 546.53 342.42 480.11 069.3
166.606 92.696 76.492 12.664 91.082 60.337 3
1757.202281.7657.743282.009.618 928.305
18287.80293.66287.04290.2021.12824.847
193.756 85.2E+43.878 05.2E+40.792 3382.10
2015.00015.00015.00014.9900.000 00.054 2
21200.001 619.1257.681 591.278.36895.920
22487.944 118.5524.374 076.8243.27660.41
235 328.05 380.35 714.95 451.02 461.0875.98
24226.60382.82225.82380.3214.62924.360
25265.07365.73264.54369.515.843 39.709 1
26321.26371.13322.91369.1910.17016.707
27597.991 205.5591.031 220.5116.85108.72
28300.003 138.4339.193 168.3214.68228.32

表 5可知,就28个测试函数优化误差的中位值、 平均值、 均方差而言,IQPSO的优化结果小于DE结果的函数个数分别为22个、 21个、 20个. 统计结果表明,IQPSO不仅优化能力优于DE,而且具有更好的稳定性.

虽然表 25的统计结果对算法性能提供了较为充分的对比,但对于一个好的算法,通常还需要进行算法优越性的显著性检验. 为了确定IQPSO是否获得了在统计意义上比其它算法更优的解,对于28个30维函数,根据IQPSO和QPSO、 GSA、 DE分别优化30次的结果,利用统计阈值α=0.05,进行了秩和检验. 该检验的原假设是: “对于同一函数,IQPSO的优化结果和其它算法的优化结果没有差异”. 检验结果如表 6所示.

表 6 采用秩和检验的算法成对测试显著性结果对比(α=0.05) Tab. 6 Pair-wise statistical comparison of the algorithms by rank sum test (α=0.05)
序号IQPSO/QPSOIQPSO/GSAIQPSO/DE
PR1R2WPR1R3WPR1R4W
12.97E-114651 365+2.97E-114651 365+2.97E-114651 365+
23.01E-114651 365+4.685E-85451 285+3.68E-111 363467-
33.01E-114651 365+8.99E-114761 354+6.69E-114731 357+
43.01E-111 365465-3.01E-111 365465-3.01E-111 365465-
53.01E-114651 365+3.01E-114651 365+3.01E-114651 365+
66.51E-95221 308+8.351E-85521 278+1.558E-85321 298+
73.01E-114651 365+3.01E-114651 365+3.01E-114651 365+
83.00E-111 365465-3.00E-111 365465-3.00E-111 365465-
93.01E-114651 365+4.97E-11470 1 360+3.01E-114651 365+
101.20E-104791 351+3.368E-56341 196+3.01E-114651 365+
113.01E-114651 365+5.07E-104941 336+3.01E-114651 365+
123.01E-114651 365+2.601E-85381 292+3.01E-114651 365+
135.49E-114711 359+9.75E-105011 329+3.01E-114651 365+
143.01E-114651 365+2.438E-95111 319+3.01E-114651 365+
150.180 8998241 006=0.371 077854976=1.606E-61 240590-
163.01E-111 365465-3.01E-111 365465-3.01E-111 365465-
173.01E-114651 365+1.102E-85281 302+3.01E-114651 365+
182.194E-81 294536-1.635E-51 207623-0.579 294877953=
193.01E-114651 365+1.410E-95051 325+3.01E-114651 365+
203.436E-71 246584-0.344 5586451 185=0.151 5284911 339=
216.282E-66091 221+0.026 0777641 066+3.01E-114651 365+
223.01E-114651 365+4.19E-104921 338+3.01E-114651 365+
230.024 1547621 068+0.033 8747711 059+0.290 472843987=
241.32E-104801 350+3.01E-114651 365+3.01E-114651 365+
251.77E-104831 347+5.49E-114711 359+3.01E-114651 365+
268.484E-91 305525-5.858E-66081 222+4.61E-104931 337+
273.01E-114651 365+3.01E-114651 365+3.01E-114651 365+
283.01E-114651 365+3.01E-114651 365+3.01E-114651 365+
+/=/-21/1/722/2/420/3/5

表 6中, P表示原假设为真的概率,R1R2R3R4分别表示IQPSO、 QPSO、 GSA、 DE的秩和,W表示显著性结果: “+”表示原假设被拒绝,IQPSO以95%的显著性水平优于另一算法; “-”表示原假设被拒绝,IQPSO以95%的显著性水平劣于另一算法; “=”表示原假设被接受,两种算法没有统计差别. 表 6最后一行给出了每组算法中IQPSO优于、 等于、 劣于对比算法的函数个数. 显著性测试结果进一步验证了提出算法的优势.

对于上述实验结果,给出如下理论分析: IQPSO的优化能力明显高于QPSO、 GSA、 DE,这是因为在IQPSO中,采用了与QPSO不同的势阱中心设置方法,同时增加了一个新的位置更新式的缘故. 在IQPSO中,每次迭代均从最优解候选集中用轮盘赌策略选择势阱中心,同时提出了一个基于粒子当前位置和平均位置的新的位置更新式,以等概率从两个位置更新式中随机选择其一,这些措施有效增强了种群多样性. 另外,最优解候选集中粒子的个数随迭代步数单调下降,也较好地保持了寻优过程中探索与开发之间的平衡.

5 在量子衍生神经网络中的应用

量子衍生神经网络是受量子计算原理的启发,采用量子旋转门和受控非门构造神经元,按量子计算原理构造输入输出关系的新型网络模型. 由于其参数较多,误差曲面极为复杂,普通梯度下降法很容易陷入局部极小. 本文以文[18]中使用的基于序列输入的量子衍生神经网络为例,采用本文提出的IQPSO算法和文[15]中的QPSO算法分别训练,并通过对比训练结果和测试结果验证IQPSO的优势. 选择基于序列输入的量子衍生神经网络,是因为该网络体现了样本的过程式输入,其参数个数远多于其它网络模型,训练难度也大于其它网络模型. 网络模型如图 1所示.

图 1 基于序列输入的量子衍生神经网络模型 Fig. 1 Sequence input-based quantum-inspired neural networks model
5.1 网络参数

网络模型中需要优化的参数有: 隐层量子旋转门的旋转角度θij(tr),输出层权值wjki=1,2,…,nj=1,2,…,pk=1,2,…,mr=1,2,…,q. 其中n为输入层节点数,p为隐层节点数,m为输出层节点数,q为输入样本的序列长度. 参数总数为D=n×p×q+p×m=(nq+m)p个.

5.2 样本数据

本实验使用的样本数据(训练和测试)来源于http://archive.ics.uci.edu/ml/datasets.html中的100种植物叶片数据集. 该数据集包括100种叶片数据,每种16个样本,共1 600个样本. 其中前20类(每类只选1个)如图 2所示. 每个样本包括64个属性值,可用64维向量描述. 为简便,只取前20类样本共320个,其中每类的前12个(共240个)作为训练集,后4个(共80个)作为测试集.

图 2 部分植物叶片样本图片 Fig. 2 Part of the plant species leaf pictures
5.3 算法设置

根据样本数据,输入样本为64维行向量; 根据量子衍生神经网络样本的构造方法,将这个64维的行向量变换为8阶方阵. 因此,网络的输入节点n=8,每个样本的序列长度q=8; 为使网络不过于复杂而又有较强逼近能力,隐层节点取p=20; 网络输出为每个样本所属的类别,用1~20的自然数表示,输出层节点数m=1. 因此网络参数共有D=(nq+m)p=(8×8+1)×20=1 300个. 分别采用IQPSO和QPSO优化这些参数. 对于粒子初始化,隐层旋转角度在(-π/2,π/2)内随机取值,输出层权值在(-1,1)内随机取值. 种群规模取100,IQPSO和QPSO的控制参数均取0.5. 算法的终止条件为到达限定迭代步数,且限定迭代步数取500. 目标函数为训练误差.

5.4 优化结果对比

为体现IQPSO的优势及优化过程的细节,在网络训练过程的每一代,都对测试集进行测试,同时记录当前代训练集样本归一化误差的最大值(E)、 训练集正确分类数(TR)、 测试集正确分类数(TE). 为减小优化结果的随机性,每种算法分别优化50次. 50次优化结束之后,IQPSO与QPSO的优化结果对比如表 7所示. 3个指标50次优化的平均值变化曲线分别如图 3图 5所示.

图 3 训练误差对比 Fig. 3 The comparison of the training error

图 4 训练正确数对比 Fig. 4 The comparison of the correct number of training results

图 5 测试正确数对比 Fig. 5 The comparison of the correct number of testing results

表 7可知,IQPSO 50次优化的平均结果,训练误差比QPSO小0.1,训练集正确数比QPSO多24个,测试集正确数比QPSO多10个. 对于优化过程的细节,从图 35可知,IQPSO的3项指标自始至终一直优于QPSO. 实验结果表明,对于含大量参数的神经网络训练这类高维优化问题,IQPSO同样优于QPSO.

表 7 IQPSO和QPSO的50次优化结果对比 Tab. 7 The comparison of 50-time optimization results between IQPSO and QPSO
序号IQPSOQPSO
ETRTEETRTE
10.026 8237600.105 223154
20.029 4239610.039 822956
30.023 9240620.054 123054
40.027 2239640.099 823158
50.026 3240640.054 122158
60.025 5240640.087 122156
70.037 4238620.154 722253
80.042 7238610.045 723455
90.031 0238660.042 322956
100.027 3239620.105 220352
110.037 8239640.104 822556
120.035 7238590.155 123352
130.029 9239660.103 623154
140.031 7238650.046 123354
150.028 8239630.045 723354
160.038 6238600.043 422757
170.031 4238600.052 222847
180.044 0238650.153 022357
190.036 4238670.156 422856
200.057 0237580.047 523155
210.036 6239640.046 923257
220.035 2237610.198 622355
230.030 0239670.105 223051
240.022 1240651.000 0124
250.040 9239630.051 622655
260.058 7235600.156 722452
270.026 0240620.055 923454
280.029 9239620.051 422958
290.038 4239670.052 122656
300.042 2238580.102 922558
310.035 1238600.041 323152
320.034 1239600.068 422450
330.035 5238610.104 523056
340.031 9239610.104 522656
350.033 4238630.078 322149
360.019 6240620.068 722348
370.027 9238620.056 623661
380.037 7238600.059 522757
390.037 7238600.060 223052
400.034 4238610.078 021457
410.027 2239620.096 523058
420.019 2240600.050 923154
430.032 0237611.000 01216
440.034 8238620.105 023056
450.029 3239640.105 219449
460.031 9238580.066 323060
470.030 5238620.048 523354
480.030 7238620.105 123354
490.026 2240601.000 0124
500.026 3240630.040 823663
平均0.032 9238620.137 121452
6 结论

提出了一种改进的量子行为粒子群优化算法. 改进算法基于最优解候选集和轮盘赌策略,重新构造了势阱中心的设计方法. 采用不同维数的标准函数极值优化和更为复杂的神经网络权值优化进行仿真验证,实验结果均表明改进算法优于原算法,从而验证了改进措施的有效性. 探索该算法在多目标约束优化问题中的应用将是下一步研究的方向.

参考文献
[1] Sun J, Xu W B, Feng B. A global search strategy of quantum-behaved particle swarm optimization[C]//Proceedings of the IEEE Conference on Cybernetics and Intelligent Systems. Piscataway, NJ, USA: IEEE, 2004: 111-116.
[2] Sun J, Wu X J, Fang W. Multiple sequence alignment using the hidden Markov model trained by an improved quantum-behaved particle swarm optimization[J]. Information Sciences, 2012, 182(1): 93-114.
[3] Sun J, Xu W B, Feng B. Adaptive parameter control for quantum-behaved particle swarm optimization on individual level[C]//2005 IEEE International Conference on System, Man, and Cybernetics. Piscataway, NJ, USA: IEEE, 2005: 3049-3054.
[4] Sun J, Wua X J, Vasile P. Convergence analysis and improvements of quantum-behaved particle swarm optimization[J]. Information Sciences, 2012, 193(3): 81-103.
[5] Coelho L S. Novel Gaussian quantum-behaved particle swarm optimizer applied to electromagnetic design[J]. IET Science, Measurement & Technology, 2007, 1(5): 290-294.
[6] Coelho L S, Nedjah N, Mourelle L M. Gaussian quantum-behaved particle swarm optimization applied to fuzzy PID controller design[J]. Studies in Computational Intelligence, 2008, 121(6): 1-15.
[7] Coelho L S. Gaussian quantum-behaved particle swarm optimization approaches for constrained engineering design problems[J]. Expert Systems with Applications, 2010, 37(2): 1676-1683.
[8] Jun S, Wei F, Vasile P. Quantum-behaved particle swarm optimization with Gaussian distributed local attractor point[J]. Applied Mathematics and Computation, 2011, 218(9): 3763-3775.
[9] Jau Y M, Su K L, Wub C J. Modified quantum-behaved particle swarm optimization for parameters estimation of generalized nonlinear multi-regressions model based on Choquet integral with outliers[J]. Applied Mathematics and Computation, 2013, 221(11): 282-295.
[10] Mostafa J, Reza S, Morteza G. Quantum behaved particle swarm optimization with differential mutation operator applied to WWER-1000 in-core fuel management optimization[J]. Annals of Nuclear Energy, 2013, 54(1): 134-140.
[11] Sun J, Fang W, Wang D J. Solving the economic dispatch problem with a modified quantum-behaved particle swarm optimization method[J]. Energy Conversion and Management, 2009, 50(8): 2967-2975.
[12] Viviana C M, Anderson R K, Fabio A G. A chaotic quantum-behaved particle swarm approach applied to optimization of heat exchangers[J]. Applied Thermal Engineering, 2012, 42(5): 119-128.
[13] Liu F, Duan H b, Deng Y M. A chaotic quantum-behaved particle swarm optimization based on lateral inhibition for image matching[J]. Optik, 2012, 123(2): 1955-1960.
[14] Giuliano B, Giulio C, Giuliano S. Principles of quantum computation and information, Volume I: Basic concepts[M]. Singapore: World Scientific, 2004: 100-112.
[15] 方伟, 孙俊, 谢振平, 等. 量子粒子群优化算法的收敛性分析及控制参数研究[J]. 物理学报, 2010, 59(6): 3686-3694. Fang W, Sun J, Xie Z P, et al. Convergence analysis of quantum-behaved particle swarm optimization algorithm and study on its control parameter[J]. Acta Physica Sinica, 2010, 59(6): 3686-3694.
[16] Liang J J, Qu B Y, Sugamthan P N, et al. Problems definition and evaluation criteria for the CEC 2013 special session on real-parameter optimization[R]. Singapore: Nanyang Technological University, 2013.
[17] Esmat R, Hossein N, Saeid S. GSA: A gravitational search algorithm[J]. Information Sciences, 2009, 179(6): 2232-2248.
[18] 肖红, 李盼池. 量子衍生神经网络及其在图像恢复中的应用[J]. 智能系统学报, 2013, 8(6): 537-542. Xiao H, Li P C. Quantum-derived neural network model and its application to image restoration[J]. CAAI Transactions on Intelligent Systems, 2013, 8(6): 537-542.
"http://dx.doi.org/10.13976/j.cnki.xk.2016.0157"
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

肖红, 李盼池
XIAO Hong, LI Panchi
改进的量子行为粒子群优化算法及其应用
Improved Quantum-behaved Particle Swarm Optimization Algorithm and Its Application
信息与控制, 2016, 45(2): 157-164.
INFORMATION AND CONTROL, 2016, 45(2): 157-164.
http://dx.doi.org/10.13976/j.cnki.xk.2016.0157

文章历史

收稿日期:2015-03-20
录用日期:2015-07-08
修回日期:2015-08-24

工作空间