Prediction of overflow concentration of thickener based on ISSA-LSTM
-
摘要: 浓缩池溢流浓度监测是实现煤泥水智能加药的关键。针对基于传感器的溢流浓度监测方式会导致絮凝剂调节滞后的问题,提出了一种基于改进麻雀搜索算法(ISSA)−长短期记忆(LSTM)的浓缩池溢流浓度预测方法。首先,对浓缩生产过程中的多参数时间序列进行相关性分析和预处理,得到输入变量。其次,采用多策略联合改进麻雀搜索算法(SSA):引入Tent混沌映射对麻雀种群进行初始化,以保证种群多样性,加快算法收敛速度;用螺旋捕食策略改进SSA的寻优过程,以兼顾局部开发和全局搜索能力;用萤火虫扰动策略对麻雀搜索结果进行扰动,以提高全局搜索能力,避免算法陷入局部最优。然后,采用ISSA优化双层LSTM网络模型的超参数。最后,构建基于ISSA−LSTM的浓缩池溢流浓度预测模型,进行在线监测。实验结果表明:① 选取Ackley函数和Rastrigin函数作为测试函数,得出ISSA的全局寻优性能和收敛速度均优于粒子群优化(PSO)算法、鲸鱼优化算法(WOA)和标准SSA。② 3种改进策略中,螺旋捕食策略对ISSA性能的提升起主导作用,混沌映射和萤火虫扰动策略协调算法的收敛速度和全局搜索能力,进一步提升算法寻优性能。③ 采用ISSA优化LSTM的超参数,解决了依靠主观经验取值时存在的欠拟合或过拟合问题,ISSA−LSTM模型的溢流浓度预测精度达97.26%,高于双层LSTM、SSA−LSTM、最小二乘支持向量机(LSSVM)等模型。④ 数据预处理可以提升模型的精度,降噪后溢流浓度预测精度比降噪前提升了30.25%。Abstract: The monitoring of the overflow concentration of the thickener is the key to realize intelligent dosing of coal slurry. The overflow concentration monitoring method based on the sensor will lead to the delay of flocculant regulation. In order to solve the above problem, a prediction method of overflow concentration of thickener based on improved sparrow search algorithm (ISSA) and long-short term memory (LSTM) is proposed. Firstly, the correlation analysis and pretreatment of multi-parameter time series in the process of concentration production are carried out to obtain the input variables. Secondly, the multi-strategies are combined to improve sparrow search algorithm (SSA). Tent chaotic map is introduced to initialize the sparrow population to ensure population diversity and speed up algorithm convergence. The optimization process of SSA is improved by using the spiral predation strategy to balance both local development and global search capabilities. The firefly perturbation strategy is used to perturb the sparrow search results to improve the global search performance and avoid the algorithm falling into local optimization. Thirdly, ISSA is used to optimize the hyperparameters of the two-layer LSTM network model. Finally, the overflow concentration prediction model based on ISSA-LSTM is established for on-line monitoring. The experimental results show the following points. ① The Ackley function and Rastigin function are selected as test functions. It is concluded that ISSA's global optimization capability and convergence speed are better than those of the particle swarm optimization (PSO) algorithm, whale optimization algorithm (WOA) and standard SSA. ② Among the three improved strategies, the spiral predation strategy plays a leading role in improving the performance of ISSA. The chaotic map and the firefly perturbation strategy coordinate the convergence speed and global search capability of the algorithm to further improve the optimization performance of the algorithm. ③ ISSA is used to optimize the hyperparameters of LSTM, which solves the problem of under-fitting or over-fitting when the values are determined by subjective experience. The prediction precision of overflow concentration of the ISSA-LSTM model reaches 97.26%, which is higher than that of double-layer LSTM, SSA-LSTM, and least square support vector machine (LSSVM) models. ④ Data pretreatment can improve the precision of the model, and the prediction precision of overflow concentration after noise reduction is improved by 30.25% compared with that before noise reduction.
-
0. 引言
煤炭洗选过程会产生大量煤泥水,若直接排放会造成矿山环境污染及水资源浪费[1]。通过添加絮凝剂对煤泥水进行浓缩是实现细粒级煤泥和水固液分离的有效途径之一。絮凝剂的添加量(即加药量)是影响浓缩效果的一个关键因素,而溢流浓度可直接反映絮凝沉降效果。目前,我国一部分选煤厂已实现加药自动化,通过传感器监测溢流浓度,再根据溢流浓度调节加药量。但是煤泥水浓缩是个大滞后的过程,基于传感器的溢流浓度监测方式会导致絮凝剂调节滞后,从而可能造成溢流浓度升高,浓缩效果变差。近些年,为了落实“中国制造2025”的强国战略,智能化建设热潮开始在选煤行业兴起[2-3]。在选煤厂智能化建设背景下,为合理添加絮凝剂,保证浓缩效果,需要构建精确、高效的溢流浓度预测模型,实现溢流浓度实时监测,从而指导絮凝剂调节。
随着深度学习技术的突破,众多深度学习模型被应用到矿业领域的预测中,主要包括浮选过程药剂量与灰分预测[4]、工作面矿压预测[5]、煤矿突水预测[6]等。在众多深度学习模型中,长短期记忆(Long Short Term Memory,LSTM)网络能够有效利用长距离的时序信息,并考虑非线性因素与时序数据之间的关系。溢流浓度数据具有时序性,且受外部因素的干扰,因此,LSTM网络适用于溢流浓度预测。
在深度学习模型建立和训练过程中,超参数设置很关键,若设置不恰当会导致模型欠拟合或过拟合,难以达到预期效果。解决这一问题的办法主要是采用优化算法进行超参数寻优,优化算法主要包括改进鲸鱼优化算法(Whale Optimization Algorithm,WOA)[7]、粒子群优化(Particle Swarm Optimization,PSO)算法[8]、量子粒子群算法[9]、改进PSO算法[10]等。麻雀搜索算法(Sparrow Search Algorithm,SSA)是新型群智能优化算法,在处理多维寻优问题时表现出较强的性能,已被成功应用于无人机航迹规划[11]和电池堆参数优化识别[12]等,但是SSA存在迭代过程中种群多样性降低、易陷入局部最优等不足。
针对上述问题,本文采用多策略对SSA进行联合改进,用改进SSA(Improved SSA,ISSA)对LSTM网络模型的超参数进行寻优,再通过优化LSTM网络模型进行浓缩池溢流浓度预测。
1. 煤泥水浓缩工艺流程
煤泥水浓缩工艺流程如图1所示。在制药装置中配置出一定浓度的絮凝剂溶解液,根据入料浓度和流量控制螺杆泵将絮凝剂添加到浓缩池的入料管道中,与待处理的煤泥水混合后进入浓缩池中进行浓缩沉降。通过溢流浓度计监测溢流浓度,判断需要调节的加药量,再通过控制柜调整变频器输出频率,从而达到调节加药量的目的。
2. 浓缩池溢流浓度预测方法
2.1 数据预处理
实验采用山西某选煤厂煤泥水浓缩池的工作运行数据,共计100组,包括5个变量:入料流量
$ {Z}_{1} $ ,入料浓度$ {Z}_{2} $ ,加药量$ {Z}_{3} $ ,底流浓度$ {Z}_{4} $ ,溢流浓度$ {Z}_{5} $ 。2.1.1 相关性分析
强相关数据在建模过程中对模型的贡献相近,引入这种数据会增加计算量,甚至影响模型预测精度。因此,对各变量之间的相关性进行分析,以剔除强相关数据。选用Spearman相关系数
$ \rho $ 对实验数据进行分析,结果如图2所示。可看出5组数据之间不存在强相关关系($ \left|\rho \right| $ =0.6~1.0),因此不需要剔除。2.1.2 数据降噪
在实验过程中,由于数据采集现场环境恶劣,干扰因素较多,采集到的数据会出现异常跳动,即存在噪声数据。噪声数据会降低模型的预测精度,因此需进行降噪处理。根据监测数据的变化特点和扰动信号的性质,选用Savitzky−Golay平滑去噪算法(简称S−G算法)对入料流量、入料浓度、加药量进行降噪处理。S−G算法参数见表1。降噪前后入料流量对比如图3所示。
表 1 S−G算法参数Table 1. Parameters of S-G algorithm参数 平滑因子 多项式次数 入料流量 0.15 2 入料浓度 0.10 1 加药量 0.15 2 采用移动均值算法对底流浓度和溢流浓度进行降噪处理,平滑因子分别为0.10和0.15。降噪前后溢流浓度对比如图4所示。
2.1.3 归一化处理
采用min−max标准化方法将5组实验数据映射到[0,1]进行归一化处理,以消除指标之间量纲差异的影响。设
$ {{\textit{z}}}_{ab} $ 为第$ b $ ($ b= \mathrm{1,2},\cdots ,5 $ )个指标的第$ a $ 个值,则归一化处理后的值为$${{\textit{z}}}_{ab}^{*}=\frac{{{\textit{z}}}_{ab}-{{\textit{z}}}_{b}^{\min}}{{{\textit{z}}}_{b}^{\max}-{{\textit{z}}}_{b}^{\min}}$$ (1) 式中
${{\textit{z}}}_{b}^{\max}$ 和${{\textit{z}}}_{b}^{\min}$ 分别为第$ b $ 个指标的最大值和最小值。2.2 双层LSTM网络模型
LSTM网络模型是循环神经网络(Recurrent Neural Network,RNN)的一种改进模型,通过引入门控单元结构来控制信息的传递量,因此可以决定历史信息和实时信息的记忆和遗忘程度,并增加了记忆存储单元,能够有效记忆数据间的特征,具有长期记忆功能,避免了RNN可能出现的梯度爆炸和梯度消失问题。
通过增加LSTM网络模型的深度,能够深度挖掘数据特征,提高网络预测精度[13-14]。但是过度增加模型深度会导致过拟合,且训练时间长;若模型深度过小,则不能提取复杂数据特征,从而学习不到输入变量与输出变量之间的映射关系,产生欠拟合问题。因此,本文通过前期实验,构建出双层LSTM网络模型,如图5所示。该模型由上到下包括1个输入层、2个LSTM层、1个全连接层和1个回归层。数据首先由输入层进入网络,然后逐层传递实现输入特征提取,最后经过全连接层得到预测值,通过回归层输出预测值。
2.3 SSA及其改进
2.3.1 SSA
SSA的主要思想来源于麻雀的觅食和反捕食行为[15]。在自然界中,麻雀种群在觅食过程中分为2个部分,一部分麻雀负责提供种群的觅食区或方向,剩余麻雀跟随前者获取食物;当麻雀发现捕食者时发出警报,种群则放弃食物并更换种群位置[16]。基于此,SSA根据理想化的行为规则建立数学模型,将麻雀种群中的个体分为发现者和跟随者,并随机分布一定数量的警戒者[17],每个个体的位置代表1个解。在觅食过程中,通过不断更新三者位置完成资源获取。
在SSA中,发现者通常具有较大的适应度值,会优先获取食物,并负责搜索食物,为所有跟随者提供觅食方向。因此,发现者的觅食搜索范围比跟随者大。在迭代过程中,发现者位置更新公式为
$$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}{\boldsymbol{X}}_{i,j}^{t}\mathrm{exp}\left(-\dfrac{i}{\alpha {t}_{\mathrm{m}\mathrm{a}\mathrm{x}}}\right)\quad\, {R}_{2} < S\\ {\boldsymbol{X}}_{i,j}^{t}+Q{\boldsymbol{L}}\qquad\qquad {R}_{2}\geqslant S\end{array}\right. $$ (2) 式中:
${\boldsymbol{X}}_{i,j}^{t}$ 为第$ t $ 次迭代时第$ i $ 只麻雀在$ j $ 维中的位置信息;$ \alpha $ 为(0,1]的随机数;$ {t}_{\mathrm{m}\mathrm{a}\mathrm{x}} $ 为最大迭代次数;$ {R}_{2} $ 为麻雀种群位置的预警值,$ {R}_{2} $ ∈[0,1];$ S $ 为麻雀种群位置的安全值,$ S $ ∈[0.5,1];$ Q $ 为服从正态分布的随机数;$ \boldsymbol{L} $ 为元素均为1的$1\times j$ 矩阵。跟随者由于适应度值较小,所以时刻监视发现者,当发现者发现更好的食物时,跟随者便改变当前位置,与发现者进行争夺。若跟随者争夺成功,则立即获得该发现者的食物,否则进行位置更新,更新公式为
$$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}Q\;\mathrm{exp}\left(\dfrac{{\boldsymbol{X}}_{\mathrm{w}\mathrm{o}\mathrm{r}\mathrm{s}\mathrm{t}}^{t}-{\boldsymbol{X}}_{i,j}^{t}}{{i}^{2}}\right)\quad\; i > \dfrac{q}{2}\\ {\boldsymbol{X}}_{\mathrm{p}}^{t}+\left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{\mathrm{p}}^{t}\right| {\boldsymbol{A}}^+ \boldsymbol{L}\right.\quad 其他\end{array}\right. $$ (3) 式中:
$ {\boldsymbol{X}}_{\mathrm{w}\mathrm{o}\mathrm{r}\mathrm{s}\mathrm{t}}^{t} $ 为当前全局最差位置;$q$ 为跟随者种群数;${\boldsymbol{X}}_{{\rm{p}}}^{t}$ 为当前最优位置;$ \boldsymbol{A} $ 为$1\times j$ 矩阵,其元素随机赋值为1或−1,且满足${\boldsymbol{A}}^{+}={\boldsymbol{A}}^{{\rm{T}}}{\left(\boldsymbol{A}{\boldsymbol{A}}^{{\rm{T}}}\right)}^{-1}$ 。在SSA中,通常假设意识到危险的麻雀占总数的 10%~20%,并且其初始位置在种群中随机产生。该类麻雀的位置更新公式为
$$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}{\boldsymbol{X}}_{{\rm{best}}}^{t}+\beta \left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{{\rm{best}}}^{t}\right|\right.\quad\;\, {f}_{i} > {f}_{{\rm{g}}}\\ {\boldsymbol{X}}_{i,j}^{t}+K\dfrac{\left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{{\rm{worst}}}^{t}\right|\right.}{{f}_{i}-{f}_{{\rm{w}}}+\varepsilon }\quad {f}_{i}={f}_{{\rm{g}}}\end{array}\right. $$ (4) 式中:
${\boldsymbol{X}}_{{\rm{best}}}^t$ 为当前全局最优位置;$\; \beta$ 为步长控制系数,为服从标准正态分布的随机数;$ {f}_{i} $ ,${f}_{{\rm{g}}}$ ,${f}_{{\rm{w}}}$ 分别为当前个体适应度值、全局最优适应度值和最差适应度值;$ K $ 为[−1,1]的随机数;$\varepsilon$ 为常数,用于避免出现分母为0的情况。2.3.2 多策略联合改进
从SSA的迭代寻优过程可知,SSA的寻优能力受种群中个体质量的影响,一旦陷入局部最优,将难以跳出当前局部空间。另外,跟随者位置主要根据
$ {X}_{{\rm{worst}}}^{t} $ 或者$ {X}_{{\rm{p}}}^{t+1} $ 进行更新, 没有充分利用种群中其他大多数个体所携带的信息,降低了算法在全局范围内的搜索能力。当SSA处理复杂的高维问题时,一旦发现者陷入局部最优,整体将难以跳出当前的局部空间。为增强SSA的全局搜索能力,避免陷入局部最优,加快收敛速度,采用以下策略进行联合改进:采用Tent映射对麻雀种群进行初始化,使个体尽可能均匀分布在搜索空间内,增强初始种群的多样性;将螺旋捕食策略应用到跟随者位置更新过程中,以兼顾局部开发和全局搜索能力;用萤火虫扰动策略对所有麻雀的位置进行扰动,增强算法跳出局部最优的能力,扩大搜索范围,提升全局搜索能力。
(1) Tent映射。传统的随机初始化方式难以保证种群的多样性,而混沌映射产生的序列具有随机性和遍历性等特点,能够使算法容易跳出局部最优,从而可以维持种群的多样性,同时提高全局搜索能力[18]。混沌映射包括Logistic映射、Tent映射、余弦映射及Circle映射等,其中Tent映射性能较好,能够产生较均匀的混沌序列[19]。Tent映射产生的混沌值与随机值对比如图6所示。
从直方图可看出,混沌值序列分布较均匀,而随机产生的值则集中分布在[0,0.33]和[0.5,0.83]这2个区间。
混沌值计算公式为
$$ {w}_{i,d+1}=\left\{\begin{array}{l}\dfrac{{w}_{i,d}}{h }\qquad\;\, 0\leqslant {w}_{i,d} < h \\ \dfrac{1-{w}_{i,d}}{1-h }\quad h \leqslant {w}_{i,d}\leqslant 1\end{array}\right. $$ (5) 式中:
${w}_{i,d} $ 为第d个混沌值,d=1,2,…,j;$h$ 为混沌参数,$h \in \left(\mathrm{0,1}\right]$ 。根据式(5)得到混沌值,将混沌值转换至种群的搜索空间中,即可生成种群个体的初始位置变量
$ {\boldsymbol{X}}_{i,j}=[{{x}}_{i,1}\;\;{{x}}_{i,2}\;\cdots \;{{x}}_{i,j}] $ ,xid为第i个个体中第d维的初始位置。$${{x}}_{i,d}={{l}_d}+{{w}}_{i,d+1}\left({u}_{d}-{l}_{d}\right) $$ (6) 式中
$ {u}_{d} $ 和$ {l}_{d} $ 分别为第$ d $ 维搜索范围的上界和下界。(2) 螺旋捕食策略。在标准SSA中,跟随者的位置往往容易被发现者的最优位置影响,发现最优位置后,种群会在短时间内向该位置迅速收缩,虽然能提升算法收敛速度,但种群多样性也会在短时间内降低,致使算法的全局搜索能力变弱,大大增加陷入局部最优的概率。针对该问题,将WOA中的螺旋捕食策略引入跟随者的位置更新过程中。螺旋捕食策略是指在鲸鱼与猎物之间创建一个螺旋等式,模仿座头鲸的螺旋状移动[20-21]。该策略既保证了收敛性,又兼顾了种群多样性,能够很好地平衡局部开发和全局搜索能力。改进后跟随者位置更新公式为
$$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}Q \mathrm{exp}\left(\dfrac{{\boldsymbol{X}}_{{\rm{worst}}}^{t}-{\boldsymbol{X}}_{i,j}^{t}}{{i}^{2}}\right)\qquad\quad i > \dfrac{q}{2}\\ {\boldsymbol{X}}_{{\rm{p}}}^{t}+{{D}}{{'}} {\exp}({{cv}}) \mathrm{cos}\left(2{\text{π}}v\right)\quad 其他\end{array}\right. $$ (7) 式中:
${{D}}{{'}}$ 为第$ t $ 次迭代时麻雀与食物(当前最优解)之间的距离,${D}{{'}}=|\left.{{\boldsymbol{X}}}_{{\rm{p}}}^{t}-{{\boldsymbol{X}}}_{i,j}^{t}|\right.$ ;$ c $ 为定义螺旋线形状的常数;$v$ 为[−1,1]的随机值。(3) 萤火虫扰动策略。在SSA迭代后期,由于麻雀个体的同化,导致算法易陷入局部最优。针对该问题,采用萤火虫扰动策略对所有麻雀位置进行一次扰动更新,增强其跳出局部最优的能力。萤火虫扰动策略是指根据萤火虫亮度进行移动,从而得到新的位置[22]。扰动后麻雀位置更新公式为
$$ {\boldsymbol{Y}}_{i,j}^{t+1}={\boldsymbol{X}}_{i,j}^{t+1}+\sigma \left({\boldsymbol{X}}_{i,j}^{t+1}-{\boldsymbol{X}}_{{\rm{p}}}^{t}\right)+\theta \left({{s}}-\dfrac{1}{2}\right) $$ (8) 式中:
$\sigma \mathrm{为}\mathrm{吸}\mathrm{引}\mathrm{度},\sigma ={\sigma }_{0} {\exp}({-\gamma {r}_{i,j}^{2}})$ ,$ {\sigma }_{0}$ 为最大吸引度,$ \gamma $ 为光强吸收系数,$ {r}_{i,j}\mathrm{为}{\boldsymbol{X}}_{i,j}^{t+1} $ 与${\boldsymbol{X}}_{{\rm{p}}}^{t}$ 之间的距离;$ \theta $ 为步长因子,取值范围为[0,1];$s$ 为[0,1]上均匀分布的随机数。改进后得到的ISSA流程如图7所示。
2.4 溢流浓度预测模型构建
基于ISSA−LSTM的浓缩池溢流浓度预测模型如图8所示。
(1) 对煤泥水浓缩过程监测到的数据集进行预处理,并按照8∶2的比例划分为训练集和测试集。
(2) 构建双层LSTM网络模型,选择Adam作为学习过程的优化算法[23],采用L2正则化防止模型过拟合。
(3) 设置优化算法的最大迭代次数tmax、空间维度j、种群规模N及LSTM网络模型的5个超参数,包括2个LSTM层的单元数、迭代次数、初始学习率和L2正则化因子。
(4) 初始化种群,将麻雀位置映射为超参数的值,以均方根误差作为个体的适应度值。
(5) 采用ISSA算法寻找最优值,并记录寻找到的位置和适应度值。
(6) 判断优化算法是否达到最大迭代次数tmax,若达到则输出最优超参数,将其赋予LSTM网络,否则返回步骤(5)。
(7) 采用输出的超参数构建溢流浓度预测模型,根据输入得到溢流浓度预测值。
3. 实验研究
3.1 预测效果评价标准
选用均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为ISSA−LSTM溢流浓度预测模型效果的评价标准。RMSE能够描述预测值与实际值的非线性拟合度,值越小,说明预测值越接近实际值;MAPE表示预测值与实际值的平均偏离程度,值越小,说明预测模型精度越高。设RMSE,MAPE的值分别为
${\delta }_{{\rm{RMSE}}} $ ,${\delta }_{{\rm{MAPE}}}$ ,其计算公式为$$ {\delta }_{{\rm{RMSE}}}=\sqrt{\frac{1}{W}\sum _{m=1}^{W}{\left({\tilde{p}}_{m}-{p}_{m}\right)}^{2}} $$ (9) $${\delta }_{{\rm{MAPE}}}=\frac{1}{W}\sum _{m=1}^{W}\left|\frac{{\tilde{p}}_{m}-{p}_{m}}{{p}_{m}}\right|\times 100{\text{%}} $$ (10) 式中:
$ W $ 为测试集数据个数;${\tilde{p}}_{m}$ 为采用ISSA−LSTM模型得到的溢流浓度预测值;$ {p}_{m} $ 为溢流浓度实测值。3.2 降噪效果验证
为验证数据降噪对溢流浓度预测精度的影响,将降噪前后各100组实验数据分别按照8∶2的比例划分训练集与测试集,用ISSA−LSTM预测模型进行对比实验,结果见表2。
表 2 降噪前后预测结果Table 2. Prediction results before and after noise reduction实验数据 RMSE MAPE/% 降噪前 492.711 5 32.99 降噪后 55.788 3 2.74 从表2可看出,降噪后实验数据的预测精度更高,RMSE约是降噪前的1/9,MAPE与降噪前相比下降了30.25%。这是由于原始实验数据中存在噪声,直接输入预测模型会导致拟合效果较差,而数据降噪可以降低噪声所占比例,从而使预测精度大幅提升。
3.3 ISSA性能测试
为了验证ISSA的寻优效果,选取Ackley函数和Rastrigin函数作为测试函数,并与PSO算法、WOA及标准SSA进行对比。
Ackley函数是一种多峰优化算法测试基准函数,存在众多局部最优解和1个全局最优解,如图9所示。可看出Ackley函数的最优解位于中心的孔洞中,周围分布着许多局部极值,孔洞的外部则较为平坦。因此,寻优过程中越靠近中心,越容易陷入局部最优,从而使优化算法难以寻找到全局最优解。Ackley函数表达式为
$$\begin{split} {F}_{10}\left({x}_{1},{x}_{2},\cdots ,{x}_{n}\right)=&-20\mathrm{exp}\left(-0.2\sqrt{\frac{1}{n}\sum _{k=1}^{n}{x}_{k}^{2}}\right)-\\& \mathrm{exp}\left[\frac{1}{n}\sum _{k=1}^{n}\mathrm{cos}\left(2{\text{π}} {x}_{k}\right)\right]+20+{\rm{e}} \end{split} $$ (11) 式中:
$x_k(k=1,2,\cdots,n)$ 为自变量,取值范围为[−32,32],定义域内最小值为0;$ n $ 为函数的维数。Rastrigin函数同样也是一种具有多个局部极小值的多峰函数,如图10所示。其搜索空间大,且在最优解周围分布着众多不同的局部极值,因此求取全局最优解也相当困难。Rastrigin函数表达式为
$$ {F}_{9}\left({x}_{1}',{x}_{2}',\cdots ,{x}_{n}'\right)=10n+\sum _{k=1}^{n}\left[{x}_{k}'^{2}-10\mathrm{cos}\left(2{\text{π}} {x}_{k}'\right)\right] $$ (12) 式中
${x}_{k}' $ 为自变量,取值范围为[−5.12,5.12],定义域内最小值为0。测试时,为了去除偶然因素引起的误差,分别对4种优化算法进行20次独立实验,最后结果取平均值。设置最大迭代次数tmax=1 000,维数j=5,测试结果如图11、图12所示。
由图11和图12可以看出,采用Ackley函数测试时,4种优化算都能够快速收敛,都搜寻到了最小值,其中ISSA最先达到平稳状态,收敛速度最快。采用Rastrigin函数测试时,PSO和WOA都陷入了局部最优且未能跳出;SSA在迭代次数为30~50时陷入1次局部最优并成功跳出,搜寻到全局最优解,说明SSA的性能优于PSO和WOA;ISSA未陷入局部最优,表现出了优秀的全局搜索能力及快速的收敛性,说明ISSA的全局寻优性能和收敛速度均优于PSO、WOA和标准SSA。
3.4 不同改进策略对比分析
为进一步探索ISSA性能影响因素,采用混沌映射、螺旋捕食、萤火虫扰动中的2种进行寻优对比实验,设置3种改进策略,对应算法分别命名为ISSA1,ISSA2,ISSA3,见表3。实验结果如图13、图14所示。
表 3 SSA改进策略Table 3. Improvement strategies of sparrow search algorithm算法 混沌映射 螺旋捕食 萤火虫扰动 ISSA1 否 是 是 ISSA2 是 否 是 ISSA3 是 是 否 由图13和图14可知,5种算法都搜索到了最小值,其中ISSA收敛速度最快且未陷入过局部最优,而其他3种改进策略的收敛速度都有不同程度下降,从快到慢依次是ISSA3,ISSA1,ISSA2。在2个测试函数的寻优过程中,ISSA2均明显陷入局部最优,导致收敛速度变慢,说明在SSA后期寻优过程中,物种多样性的降低会使优化算法易陷入局部最优。在Ackley测试函数的收敛曲线上,与ISSA相比,可以明显看到ISSA3陷入过1次局部最优,说明去除萤火虫扰动后,算法的全局搜索能力有所减弱。基于此,可得出螺旋捕食策略对ISSA性能的提升起主导作用,混沌映射和萤火虫扰动策略协调算法的收敛速度和全局搜索能力,进一步提升算法寻优性能。
3.5 ISSA−LSTM网络模型的训练及优化结果
3.5.1 实验条件及超参数设定
基于Matlab R2021a软件搭建LSTM网络,硬件参数见表4。
表 4 设备硬件参数Table 4. Equipment hardware parameters设备名称 DESKTOP−3ER5HIS 处理器 11th Gen Intel(R) Core(TM)
i7−11800H @ 2.30 GHz机带RAM 32.0 GB 系统类型 64位操作系统 设置ISSA种群规模为30,最大迭代次数为100, LSTM网络的超参数设置见表5。
表 5 超参数设置Table 5. Setting of hyperparameters超参数 设定值 第1层神经元个数${M}_{1}$ [10,150] 第2层神经元个数${M}_{2}$ [10,60] 初始学习率$ {I}_{1} $ [10−5,1] L2正则化因子$ {I}_{2} $ [10−6,1] 最大迭代次数$t_{\rm{max}}$ 400 3.5.2 优化结果
采用标准SSA和ISSA对LSTM网络的超参数进行寻优,结果如图15所示。
由图15可知,ISSA−LSTM的适应度值比SSA−LSTM小,说明ISSA比SSA具有更强的跳出局部最优的能力,即全局寻优性能更好,并且ISSA收敛速度更快。SSA寻找到的最优超参数:
$ {M}_{1}=65 $ ,$ {M}_{2}=10 $ ,$ {I}_{1}=0.074 $ ,$ {I}_{2}=0.003 $ 。ISSA寻找到的最优超参数:$ {M}_{1}=125,{M}_{2}=10,{I}_{1}=0.068,{I}_{2}=0.064 $ 。3.6 不同模型对比分析
为验证ISSA−LSTM模型的预测精度,与双层LSTM模型、SSA−LSTM模型及最小二乘支持向量机(Least Squares Support Vector Machines,LSSVM)模型进行对比。双层LSTM模型中,设置最大迭代次数为400,初始学习率为0.02,学习率衰减因子为0.008;SSA−LSTM模型中,设置最大迭代次数为400,种群数量为30,优化算法的最大迭代次数为100;LSSVM模型中,正则化参数和径向基函数(Radial Basis Function,RBF)的参数分别设置为0.5和0.4。不同模型预测结果对比如图16所示,评价指标对比见表6。
表 6 不同模型评价指标对比Table 6. Comparison of evaluation indicator of different models模型 RMSE MAPE/% ISSA−LSTM 55.788 3 2.74 SSA−LSTM 56.237 0 3.08 LSSVM 74.490 2 3.67 双层LSTM 81.259 7 3.98 由图16和表6可知,双层LSTM模型的预测误差最大,RMSE和MAPE比ISSA−LSTM模型高25.4714和1.24%,说明超参数对模型的影响较大;LSSVM模型用于长时间序列预测时表现稍差,RMSE和MAPE比ISSA−LSTM模型高18.7019和0.93%;SSA−LSTM模型因为采用SSA进行超参数寻优,RMSE和MAPE分别比双层LSTM模型降低了25.0227和0.9%,但比ISSA−LSTM模型高0.4487和0.34%。ISSA−LSTM模型的RMSE和MAPE的值分别为55.7883和2.74%,均低于其他对比模型,溢流浓度预测精度达97.26%,验证了将ISSA−LSTM模型用于溢流浓度预测的有效性。
4. 结论
(1) 通过Tent混沌映射、螺旋捕食策略和萤火虫扰动策略改进SSA,增强了SSA跳出局部最优的能力,提高了收敛速度。
(2) 对比分析发现,从种群初始化、个体更新和整体扰动3个角度出发所提出的改进策略具有互补性,使得ISSA具有更好的收敛性能、整体寻优能力与求解稳定性,3种改进策略对算法的影响程度从大到小为螺旋捕食、混沌映射、萤火虫扰动。
(3) 采用ISSA优化LSTM的超参数,解决了依靠主观经验取值时存在的欠拟合或过拟合问题。将ISSA−LSTM模型应用于溢流浓度预测中,预测精度达97.26%,高于SSA−LSTM、LSSVM、双层LSTM等模型。
(4) 数据预处理可以提升模型的精度,降噪后溢流浓度预测精度比降噪前提升了30.25%。
-
表 1 S−G算法参数
Table 1 Parameters of S-G algorithm
参数 平滑因子 多项式次数 入料流量 0.15 2 入料浓度 0.10 1 加药量 0.15 2 表 2 降噪前后预测结果
Table 2 Prediction results before and after noise reduction
实验数据 RMSE MAPE/% 降噪前 492.711 5 32.99 降噪后 55.788 3 2.74 表 3 SSA改进策略
Table 3 Improvement strategies of sparrow search algorithm
算法 混沌映射 螺旋捕食 萤火虫扰动 ISSA1 否 是 是 ISSA2 是 否 是 ISSA3 是 是 否 表 4 设备硬件参数
Table 4 Equipment hardware parameters
设备名称 DESKTOP−3ER5HIS 处理器 11th Gen Intel(R) Core(TM)
i7−11800H @ 2.30 GHz机带RAM 32.0 GB 系统类型 64位操作系统 表 5 超参数设置
Table 5 Setting of hyperparameters
超参数 设定值 第1层神经元个数${M}_{1}$ [10,150] 第2层神经元个数${M}_{2}$ [10,60] 初始学习率$ {I}_{1} $ [10−5,1] L2正则化因子$ {I}_{2} $ [10−6,1] 最大迭代次数$t_{\rm{max}}$ 400 表 6 不同模型评价指标对比
Table 6 Comparison of evaluation indicator of different models
模型 RMSE MAPE/% ISSA−LSTM 55.788 3 2.74 SSA−LSTM 56.237 0 3.08 LSSVM 74.490 2 3.67 双层LSTM 81.259 7 3.98 -
[1] 冯甜欣,张晓光,刘景勇,等. 基于云平台的选煤厂环境监测系统[J]. 工矿自动化,2021,47(10):121-126. FENG Tianxin,ZHANG Xiaoguang,LIU Jingyong,et al. Environmental monitoring system of coal preparation plant based on cloud platform[J]. Industry and Mine Automation,2021,47(10):121-126.
[2] 董永胜,陈为高,侯佃平,等. 智能化选煤厂研究与建议[J]. 工矿自动化,2021,47(增刊1):26-31. DONG Yongsheng,CHEN Weigao,HOU Dianping,et al. Research and suggestions on intelligent coal preparation plant[J]. Industry and Mine Automation,2021,47(S1):26-31.
[3] 李朋,张明远,王保强. 分级破碎机智能化技术现状与发展方向[J]. 煤炭工程,2022,54(1):133-136. LI Peng,ZHANG Mingyuan,WANG Baoqiang. Status and development trends of intelligent technology of sizing crusher[J]. Coal Engineering,2022,54(1):133-136.
[4] 陈铭. 基于深度学习的浮选过程智能控制研究[D]. 徐州: 中国矿业大学, 2020. CHEN Ming. Study on the intelligent control of flotation process based on deep learning[D]. Xuzhou: China University of Mining and Technology, 2020.
[5] 赵毅鑫,杨志良,马斌杰,等. 基于深度学习的大采高工作面矿压预测分析及模型泛化[J]. 煤炭学报,2020,45(1):54-65. ZHAO Yixin,YANG Zhiliang,MA Binjie,et al. Deep learning prediction and model generalization of ground pressure for deep longwall face with large mining height[J]. Journal of China Coal Society,2020,45(1):54-65.
[6] 董丽丽,费城,张翔,等. 基于LSTM神经网络的煤矿突水预测[J]. 煤田地质与勘探,2019,47(2):137-143. DONG Lili,FEI Cheng,ZHANG Xiang,et al. Coal mine water inrush prediction based on LSTM neural network[J]. Coal Geology & Exploration,2019,47(2):137-143.
[7] 刘立邦,杨颂,王志坚,等. 基于改进WOA−LSTM的焦炭质量预测[J]. 化工学报,2022,73(3):1291-1299. LIU Libang,YANG Song,WANG Zhijian,et al. Prediction of coke quality based on improved WOA-LSTM[J]. CIESC Journal,2022,73(3):1291-1299.
[8] 宋刚,张云峰,包芳勋,等. 基于粒子群优化LSTM的股票预测模型[J]. 北京航空航天大学学报,2019,45(12):2533-2542. DOI: 10.13700/j.bh.1001-5965.2019.0388 SONG Gang,ZHANG Yunfeng,BAO Fangxun,et al. Stock prediction model based on particle swarm optimization LSTM[J]. Journal of Beijing University of Aeronautics and Astronautics,2019,45(12):2533-2542. DOI: 10.13700/j.bh.1001-5965.2019.0388
[9] 付华,赵俊程,付昱,等. 基于量子粒子群与深度学习的煤矿瓦斯涌出量软测量[J]. 仪器仪表学报,2021,42(4):160-168. DOI: 10.19650/j.cnki.cjsi.J2107486 FU Hua,ZHAO Juncheng,FU Yu,et al. Soft measurement of coal mine gas emission based on quantum-behaved particle swarm optimization and deep learning[J]. Chinese Journal of Scientific Instrument,2021,42(4):160-168. DOI: 10.19650/j.cnki.cjsi.J2107486
[10] 吴磊,康英伟. 基于改进粒子群优化长短时记忆神经网络的脱硫系统SO2预测模型[J]. 热力发电,2021,50(12):66-73. WU Lei,KANG Yingwei. Prediction model of SO2 concentration in desulfurization system based on improved particle swarm optimization LSTM[J]. Thermal Power Generation,2021,50(12):66-73.
[11] LIU Guiyun,SHU Cong,LIANG Zhongwei,et al. A modified sparrow search algorithm with application in 3D route planning for UAV[J]. Sensors,2021,21(4):1224. DOI: 10.3390/s21041224
[12] ZHU Yanlong,YOUSEFI N. Optimal parameter identification of PEMFC stacks using adaptive sparrow search algorithm[J]. International Journal of Hydrogen Energy,2021,46(14):9541-9552. DOI: 10.1016/j.ijhydene.2020.12.107
[13] 贾澎涛,苗云风. 基于堆叠LSTM的多源矿压预测模型分析[J]. 矿业研究与开发,2021,41(8):79-82. JIA Pengtao,MIAO Yunfeng. Multi-source mine pressure prediction model analysis based on stacked-LSTM[J]. Mining Research and Development,2021,41(8):79-82.
[14] XING Yin,YUE Jianping,CHEN Chuang,et al. Dynamic displacement forecasting of dashuitian landslide in China using variational mode decomposition and stack long short-term memory network[J]. Applied Sciences,2019,9(15):2951-2962. DOI: 10.3390/app9152951
[15] XUE Jiankai,SHEN Bo. A novel swarm intelligence optimization approach:sparrow search algorithm[J]. Systems Science & Control Engineering,2020,8(1):22-34.
[16] 吕鑫,慕晓冬,张钧. 基于改进麻雀搜索算法的多阈值图像分割[J]. 系统工程与电子技术,2021,43(2):318-327. DOI: 10.12305/j.issn.1001-506X.2021.02.05 LYU Xin,MU Xiaodong,ZHANG Jun. Multi-threshold image segmentation based on improved sparrow search algorithm[J]. Systems Engineering and Electronics,2021,43(2):318-327. DOI: 10.12305/j.issn.1001-506X.2021.02.05
[17] 吴新忠,韩正化,魏连江,等. 矿井风流智能按需调控算法与关键技术[J]. 中国矿业大学学报,2021,50(4):725-734. DOI: 10.13247/j.cnki.jcumt.001316 WU Xinzhong,HAN Zhenghua,WEI Lianjiang,et al. Intelligent on-demand adjustment algorithm and key technology of mine air flow[J]. Journal of China University of Mining & Technology,2021,50(4):725-734. DOI: 10.13247/j.cnki.jcumt.001316
[18] 滕志军,吕金玲,郭力文,等. 一种基于Tent映射的混合灰狼优化的改进算法[J]. 哈尔滨工业大学学报,2018,50(11):40-49. DOI: 10.11918/j.issn.0367-6234.201806096 TENG Zhijun,LYU Jinling,GUO Liwen,et al. An improved hybrid grey wolf optimization algorithm based on Tent mapping[J]. Journal of Harbin Institute of Technology,2018,50(11):40-49. DOI: 10.11918/j.issn.0367-6234.201806096
[19] DEMIDOVA L,GORCHAKOV A V. A study of chaotic maps producing symmetric distributions in the fish school search optimization algorithm with exponential step decay[J]. Symmetry,2020,12(5):784-801. DOI: 10.3390/sym12050784
[20] MIRJALILI S,LEWIS A. The whale optimization algorithm[J]. Advances in Engineering Software,2016,95:51-67. DOI: 10.1016/j.advengsoft.2016.01.008
[21] 孙林,黄金旭,徐久成,等. 基于自适应鲸鱼优化算法和容错邻域粗糙集的特征选择算法[J]. 模式识别与人工智能,2022,35(2):150-165. DOI: 10.16451/j.cnki.issn1003-6059.202202006 SUN Lin,HUANG Jinxu,XU Jiucheng,et al. Feature selection based on adaptive whale optimization algorithm and fault-tolerance neighborhood rough sets[J]. Pattern Recognition and Artificial Intelligence,2022,35(2):150-165. DOI: 10.16451/j.cnki.issn1003-6059.202202006
[22] 柳长安,冯雪菱,孙长浩,等. 基于改进麻雀算法的最大2维熵分割方法[J]. 激光技术,2022,46(2):274-282. DOI: 10.7510/jgjs.issn.1001-3806.2022.02.020 LIU Chang'an,FENG Xueling,SUN Changhao,et al. Maximum two-dimensional entropy segmentation method based on improved sparrow algorithm[J]. Laser Technology,2022,46(2):274-282. DOI: 10.7510/jgjs.issn.1001-3806.2022.02.020
[23] 曹通,白艳萍. 基于梯度下降优化的LSTM对空气质量预测研究[J]. 陕西科技大学学报,2020,38(6):159-164. DOI: 10.3969/j.issn.1000-5811.2020.06.026 CAO Tong,BAI Yanping. Study on the prediction of air quality based on LSTM with gradient descent optimization[J]. Journal of Shaanxi University of Science & Technology,2020,38(6):159-164. DOI: 10.3969/j.issn.1000-5811.2020.06.026
-
期刊类型引用(4)
1. 王宇飞. 煤泥水智能加药系统的研究现状. 煤炭技术. 2025(04): 287-290 . 百度学术
2. 王汾青. 选煤场浓缩池溢流浓度控制方法研究. 工业仪表与自动化装置. 2024(01): 83-86+91 . 百度学术
3. 姜汉国,柴东元,戴恩哲,胡玉. 基于人工智能的大型光伏电站风险预控技术研究. 粘接. 2024(08): 146-149 . 百度学术
4. 李博,杨小权,乔少利. 选煤厂煤泥水系统智能压滤技术应用研究. 矿业安全与环保. 2024(06): 200-204 . 百度学术
其他类型引用(6)