基于ISSA−LSTM的浓缩池溢流浓度预测

张洋洋, 樊玉萍, 马晓敏, 董宪姝, 金伟, 王大卫

张洋洋,樊玉萍,马晓敏,等. 基于ISSA−LSTM的浓缩池溢流浓度预测[J]. 工矿自动化,2022,48(11):63-72. DOI: 10.13272/j.issn.1671-251x.2022060084
引用本文: 张洋洋,樊玉萍,马晓敏,等. 基于ISSA−LSTM的浓缩池溢流浓度预测[J]. 工矿自动化,2022,48(11):63-72. DOI: 10.13272/j.issn.1671-251x.2022060084
ZHANG Yangyang, FAN Yuping, MA Xiaomin, et al. Prediction of overflow concentration of thickener based on ISSA-LSTM[J]. Journal of Mine Automation,2022,48(11):63-72. DOI: 10.13272/j.issn.1671-251x.2022060084
Citation: ZHANG Yangyang, FAN Yuping, MA Xiaomin, et al. Prediction of overflow concentration of thickener based on ISSA-LSTM[J]. Journal of Mine Automation,2022,48(11):63-72. DOI: 10.13272/j.issn.1671-251x.2022060084

基于ISSA−LSTM的浓缩池溢流浓度预测

基金项目: 国家自然科学基金重点国际(地区)合作研究项目(51820105006);国家自然科学基金面上项目(52074189);国家自然科学基金青年科学基金项目(52004178)。
详细信息
    作者简介:

    张洋洋(1997—),男,安徽阜阳人,硕士研究生,研究方向为选煤智能化,E-mail:1278290544@qq.com

    通讯作者:

    樊玉萍(1988—),女,山西临汾人,副教授,硕士研究生导师,主要从事煤炭清洁高效利用方面的研究工作,E-mail:19880628fyp@163.com

  • 中图分类号: TD94

Prediction of overflow concentration of thickener based on ISSA-LSTM

  • 摘要: 浓缩池溢流浓度监测是实现煤泥水智能加药的关键。针对基于传感器的溢流浓度监测方式会导致絮凝剂调节滞后的问题,提出了一种基于改进麻雀搜索算法(ISSA)−长短期记忆(LSTM)的浓缩池溢流浓度预测方法。首先,对浓缩生产过程中的多参数时间序列进行相关性分析和预处理,得到输入变量。其次,采用多策略联合改进麻雀搜索算法(SSA):引入Tent混沌映射对麻雀种群进行初始化,以保证种群多样性,加快算法收敛速度;用螺旋捕食策略改进SSA的寻优过程,以兼顾局部开发和全局搜索能力;用萤火虫扰动策略对麻雀搜索结果进行扰动,以提高全局搜索能力,避免算法陷入局部最优。然后,采用ISSA优化双层LSTM网络模型的超参数。最后,构建基于ISSA−LSTM的浓缩池溢流浓度预测模型,进行在线监测。实验结果表明:① 选取Ackley函数和Rastrigin函数作为测试函数,得出ISSA的全局寻优性能和收敛速度均优于粒子群优化(PSO)算法、鲸鱼优化算法(WOA)和标准SSA。② 3种改进策略中,螺旋捕食策略对ISSA性能的提升起主导作用,混沌映射和萤火虫扰动策略协调算法的收敛速度和全局搜索能力,进一步提升算法寻优性能。③ 采用ISSA优化LSTM的超参数,解决了依靠主观经验取值时存在的欠拟合或过拟合问题,ISSA−LSTM模型的溢流浓度预测精度达97.26%,高于双层LSTM、SSA−LSTM、最小二乘支持向量机(LSSVM)等模型。④ 数据预处理可以提升模型的精度,降噪后溢流浓度预测精度比降噪前提升了30.25%。
    Abstract: The monitoring of the overflow concentration of the thickener is the key to realize intelligent dosing of coal slurry. The overflow concentration monitoring method based on the sensor will lead to the delay of flocculant regulation. In order to solve the above problem, a prediction method of overflow concentration of thickener based on improved sparrow search algorithm (ISSA) and long-short term memory (LSTM) is proposed. Firstly, the correlation analysis and pretreatment of multi-parameter time series in the process of concentration production are carried out to obtain the input variables. Secondly, the multi-strategies are combined to improve sparrow search algorithm (SSA). Tent chaotic map is introduced to initialize the sparrow population to ensure population diversity and speed up algorithm convergence. The optimization process of SSA is improved by using the spiral predation strategy to balance both local development and global search capabilities. The firefly perturbation strategy is used to perturb the sparrow search results to improve the global search performance and avoid the algorithm falling into local optimization. Thirdly, ISSA is used to optimize the hyperparameters of the two-layer LSTM network model. Finally, the overflow concentration prediction model based on ISSA-LSTM is established for on-line monitoring. The experimental results show the following points. ① The Ackley function and Rastigin function are selected as test functions. It is concluded that ISSA's global optimization capability and convergence speed are better than those of the particle swarm optimization (PSO) algorithm, whale optimization algorithm (WOA) and standard SSA. ② Among the three improved strategies, the spiral predation strategy plays a leading role in improving the performance of ISSA. The chaotic map and the firefly perturbation strategy coordinate the convergence speed and global search capability of the algorithm to further improve the optimization performance of the algorithm. ③ ISSA is used to optimize the hyperparameters of LSTM, which solves the problem of under-fitting or over-fitting when the values are determined by subjective experience. The prediction precision of overflow concentration of the ISSA-LSTM model reaches 97.26%, which is higher than that of double-layer LSTM, SSA-LSTM, and least square support vector machine (LSSVM) models. ④ Data pretreatment can improve the precision of the model, and the prediction precision of overflow concentration after noise reduction is improved by 30.25% compared with that before noise reduction.
  • 煤炭洗选过程会产生大量煤泥水,若直接排放会造成矿山环境污染及水资源浪费[1]。通过添加絮凝剂对煤泥水进行浓缩是实现细粒级煤泥和水固液分离的有效途径之一。絮凝剂的添加量(即加药量)是影响浓缩效果的一个关键因素,而溢流浓度可直接反映絮凝沉降效果。目前,我国一部分选煤厂已实现加药自动化,通过传感器监测溢流浓度,再根据溢流浓度调节加药量。但是煤泥水浓缩是个大滞后的过程,基于传感器的溢流浓度监测方式会导致絮凝剂调节滞后,从而可能造成溢流浓度升高,浓缩效果变差。近些年,为了落实“中国制造2025”的强国战略,智能化建设热潮开始在选煤行业兴起[2-3]。在选煤厂智能化建设背景下,为合理添加絮凝剂,保证浓缩效果,需要构建精确、高效的溢流浓度预测模型,实现溢流浓度实时监测,从而指导絮凝剂调节。

    随着深度学习技术的突破,众多深度学习模型被应用到矿业领域的预测中,主要包括浮选过程药剂量与灰分预测[4]、工作面矿压预测[5]、煤矿突水预测[6]等。在众多深度学习模型中,长短期记忆(Long Short Term Memory,LSTM)网络能够有效利用长距离的时序信息,并考虑非线性因素与时序数据之间的关系。溢流浓度数据具有时序性,且受外部因素的干扰,因此,LSTM网络适用于溢流浓度预测。

    在深度学习模型建立和训练过程中,超参数设置很关键,若设置不恰当会导致模型欠拟合或过拟合,难以达到预期效果。解决这一问题的办法主要是采用优化算法进行超参数寻优,优化算法主要包括改进鲸鱼优化算法(Whale Optimization Algorithm,WOA)[7]、粒子群优化(Particle Swarm Optimization,PSO)算法[8]、量子粒子群算法[9]、改进PSO算法[10]等。麻雀搜索算法(Sparrow Search Algorithm,SSA)是新型群智能优化算法,在处理多维寻优问题时表现出较强的性能,已被成功应用于无人机航迹规划[11]和电池堆参数优化识别[12]等,但是SSA存在迭代过程中种群多样性降低、易陷入局部最优等不足。

    针对上述问题,本文采用多策略对SSA进行联合改进,用改进SSA(Improved SSA,ISSA)对LSTM网络模型的超参数进行寻优,再通过优化LSTM网络模型进行浓缩池溢流浓度预测。

    煤泥水浓缩工艺流程如图1所示。在制药装置中配置出一定浓度的絮凝剂溶解液,根据入料浓度和流量控制螺杆泵将絮凝剂添加到浓缩池的入料管道中,与待处理的煤泥水混合后进入浓缩池中进行浓缩沉降。通过溢流浓度计监测溢流浓度,判断需要调节的加药量,再通过控制柜调整变频器输出频率,从而达到调节加药量的目的。

    图  1  煤泥水浓缩工艺流程
    Figure  1.  Concentration process flow of coal slurry

    实验采用山西某选煤厂煤泥水浓缩池的工作运行数据,共计100组,包括5个变量:入料流量$ {Z}_{1} $,入料浓度$ {Z}_{2} $,加药量$ {Z}_{3} $,底流浓度$ {Z}_{4} $,溢流浓度$ {Z}_{5} $

    强相关数据在建模过程中对模型的贡献相近,引入这种数据会增加计算量,甚至影响模型预测精度。因此,对各变量之间的相关性进行分析,以剔除强相关数据。选用Spearman相关系数$ \rho $对实验数据进行分析,结果如图2所示。可看出5组数据之间不存在强相关关系($ \left|\rho \right| $=0.6~1.0),因此不需要剔除。

    图  2  Spearman相关性分析热力图
    Figure  2.  Thermodynamic diagram of Spearman correlation analysis

    在实验过程中,由于数据采集现场环境恶劣,干扰因素较多,采集到的数据会出现异常跳动,即存在噪声数据。噪声数据会降低模型的预测精度,因此需进行降噪处理。根据监测数据的变化特点和扰动信号的性质,选用Savitzky−Golay平滑去噪算法(简称S−G算法)对入料流量、入料浓度、加药量进行降噪处理。S−G算法参数见表1。降噪前后入料流量对比如图3所示。

    表  1  S−G算法参数
    Table  1.  Parameters of S-G algorithm
    参数平滑因子多项式次数
    入料流量0.152
    入料浓度0.101
    加药量0.152
    下载: 导出CSV 
    | 显示表格
    图  3  降噪前后入料流量对比
    Figure  3.  Comparison of feed flow before and after noise reduction

    采用移动均值算法对底流浓度和溢流浓度进行降噪处理,平滑因子分别为0.10和0.15。降噪前后溢流浓度对比如图4所示。

    图  4  降噪前后溢流浓度对比
    Figure  4.  Comparison of overflow concentration before and after noise reduction

    采用min−max标准化方法将5组实验数据映射到[0,1]进行归一化处理,以消除指标之间量纲差异的影响。设$ {{\textit{z}}}_{ab} $为第$ b $$ b= \mathrm{1,2},\cdots ,5 $)个指标的第$ a $个值,则归一化处理后的值为

    $${{\textit{z}}}_{ab}^{*}=\frac{{{\textit{z}}}_{ab}-{{\textit{z}}}_{b}^{\min}}{{{\textit{z}}}_{b}^{\max}-{{\textit{z}}}_{b}^{\min}}$$ (1)

    式中${{\textit{z}}}_{b}^{\max}$${{\textit{z}}}_{b}^{\min}$分别为第$ b $个指标的最大值和最小值。

    LSTM网络模型是循环神经网络(Recurrent Neural Network,RNN)的一种改进模型,通过引入门控单元结构来控制信息的传递量,因此可以决定历史信息和实时信息的记忆和遗忘程度,并增加了记忆存储单元,能够有效记忆数据间的特征,具有长期记忆功能,避免了RNN可能出现的梯度爆炸和梯度消失问题。

    通过增加LSTM网络模型的深度,能够深度挖掘数据特征,提高网络预测精度[13-14]。但是过度增加模型深度会导致过拟合,且训练时间长;若模型深度过小,则不能提取复杂数据特征,从而学习不到输入变量与输出变量之间的映射关系,产生欠拟合问题。因此,本文通过前期实验,构建出双层LSTM网络模型,如图5所示。该模型由上到下包括1个输入层、2个LSTM层、1个全连接层和1个回归层。数据首先由输入层进入网络,然后逐层传递实现输入特征提取,最后经过全连接层得到预测值,通过回归层输出预测值。

    图  5  双层LSTM网络结构
    Figure  5.  Structure of double-layer LSTM network

    SSA的主要思想来源于麻雀的觅食和反捕食行为[15]。在自然界中,麻雀种群在觅食过程中分为2个部分,一部分麻雀负责提供种群的觅食区或方向,剩余麻雀跟随前者获取食物;当麻雀发现捕食者时发出警报,种群则放弃食物并更换种群位置[16]。基于此,SSA根据理想化的行为规则建立数学模型,将麻雀种群中的个体分为发现者和跟随者,并随机分布一定数量的警戒者[17],每个个体的位置代表1个解。在觅食过程中,通过不断更新三者位置完成资源获取。

    在SSA中,发现者通常具有较大的适应度值,会优先获取食物,并负责搜索食物,为所有跟随者提供觅食方向。因此,发现者的觅食搜索范围比跟随者大。在迭代过程中,发现者位置更新公式为

    $$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}{\boldsymbol{X}}_{i,j}^{t}\mathrm{exp}\left(-\dfrac{i}{\alpha {t}_{\mathrm{m}\mathrm{a}\mathrm{x}}}\right)\quad\, {R}_{2} < S\\ {\boldsymbol{X}}_{i,j}^{t}+Q{\boldsymbol{L}}\qquad\qquad {R}_{2}\geqslant S\end{array}\right. $$ (2)

    式中:${\boldsymbol{X}}_{i,j}^{t}$为第$ t $次迭代时第$ i $只麻雀在$ j $维中的位置信息;$ \alpha $为(0,1]的随机数;$ {t}_{\mathrm{m}\mathrm{a}\mathrm{x}} $为最大迭代次数;$ {R}_{2} $为麻雀种群位置的预警值,$ {R}_{2} $∈[0,1];$ S $为麻雀种群位置的安全值,$ S $∈[0.5,1];$ Q $为服从正态分布的随机数;$ \boldsymbol{L} $为元素均为1的$1\times j$矩阵。

    跟随者由于适应度值较小,所以时刻监视发现者,当发现者发现更好的食物时,跟随者便改变当前位置,与发现者进行争夺。若跟随者争夺成功,则立即获得该发现者的食物,否则进行位置更新,更新公式为

    $$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}Q\;\mathrm{exp}\left(\dfrac{{\boldsymbol{X}}_{\mathrm{w}\mathrm{o}\mathrm{r}\mathrm{s}\mathrm{t}}^{t}-{\boldsymbol{X}}_{i,j}^{t}}{{i}^{2}}\right)\quad\; i > \dfrac{q}{2}\\ {\boldsymbol{X}}_{\mathrm{p}}^{t}+\left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{\mathrm{p}}^{t}\right| {\boldsymbol{A}}^+ \boldsymbol{L}\right.\quad 其他\end{array}\right. $$ (3)

    式中:$ {\boldsymbol{X}}_{\mathrm{w}\mathrm{o}\mathrm{r}\mathrm{s}\mathrm{t}}^{t} $为当前全局最差位置;$q$为跟随者种群数;${\boldsymbol{X}}_{{\rm{p}}}^{t}$为当前最优位置;$ \boldsymbol{A} $$1\times j$矩阵,其元素随机赋值为1或−1,且满足${\boldsymbol{A}}^{+}={\boldsymbol{A}}^{{\rm{T}}}{\left(\boldsymbol{A}{\boldsymbol{A}}^{{\rm{T}}}\right)}^{-1}$

    在SSA中,通常假设意识到危险的麻雀占总数的 10%~20%,并且其初始位置在种群中随机产生。该类麻雀的位置更新公式为

    $$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}{\boldsymbol{X}}_{{\rm{best}}}^{t}+\beta \left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{{\rm{best}}}^{t}\right|\right.\quad\;\, {f}_{i} > {f}_{{\rm{g}}}\\ {\boldsymbol{X}}_{i,j}^{t}+K\dfrac{\left|{\boldsymbol{X}}_{i,j}^{t}-\left.{\boldsymbol{X}}_{{\rm{worst}}}^{t}\right|\right.}{{f}_{i}-{f}_{{\rm{w}}}+\varepsilon }\quad {f}_{i}={f}_{{\rm{g}}}\end{array}\right. $$ (4)

    式中:${\boldsymbol{X}}_{{\rm{best}}}^t$为当前全局最优位置;$\; \beta$为步长控制系数,为服从标准正态分布的随机数;$ {f}_{i} $${f}_{{\rm{g}}}$${f}_{{\rm{w}}}$分别为当前个体适应度值、全局最优适应度值和最差适应度值;$ K $为[−1,1]的随机数;$\varepsilon$为常数,用于避免出现分母为0的情况。

    从SSA的迭代寻优过程可知,SSA的寻优能力受种群中个体质量的影响,一旦陷入局部最优,将难以跳出当前局部空间。另外,跟随者位置主要根据$ {X}_{{\rm{worst}}}^{t} $或者$ {X}_{{\rm{p}}}^{t+1} $进行更新, 没有充分利用种群中其他大多数个体所携带的信息,降低了算法在全局范围内的搜索能力。当SSA处理复杂的高维问题时,一旦发现者陷入局部最优,整体将难以跳出当前的局部空间。

    为增强SSA的全局搜索能力,避免陷入局部最优,加快收敛速度,采用以下策略进行联合改进:采用Tent映射对麻雀种群进行初始化,使个体尽可能均匀分布在搜索空间内,增强初始种群的多样性;将螺旋捕食策略应用到跟随者位置更新过程中,以兼顾局部开发和全局搜索能力;用萤火虫扰动策略对所有麻雀的位置进行扰动,增强算法跳出局部最优的能力,扩大搜索范围,提升全局搜索能力。

    (1) Tent映射。传统的随机初始化方式难以保证种群的多样性,而混沌映射产生的序列具有随机性和遍历性等特点,能够使算法容易跳出局部最优,从而可以维持种群的多样性,同时提高全局搜索能力[18]。混沌映射包括Logistic映射、Tent映射、余弦映射及Circle映射等,其中Tent映射性能较好,能够产生较均匀的混沌序列[19]。Tent映射产生的混沌值与随机值对比如图6所示。

    图  6  Tent映射混沌值与随机值对比
    Figure  6.  Comparison of chaotic value and random value of Tent map

    从直方图可看出,混沌值序列分布较均匀,而随机产生的值则集中分布在[0,0.33]和[0.5,0.83]这2个区间。

    混沌值计算公式为

    $$ {w}_{i,d+1}=\left\{\begin{array}{l}\dfrac{{w}_{i,d}}{h }\qquad\;\, 0\leqslant {w}_{i,d} < h \\ \dfrac{1-{w}_{i,d}}{1-h }\quad h \leqslant {w}_{i,d}\leqslant 1\end{array}\right. $$ (5)

    式中:${w}_{i,d} $为第d个混沌值,d=1,2,…,j$h$为混沌参数,$h \in \left(\mathrm{0,1}\right]$

    根据式(5)得到混沌值,将混沌值转换至种群的搜索空间中,即可生成种群个体的初始位置变量$ {\boldsymbol{X}}_{i,j}=[{{x}}_{i,1}\;\;{{x}}_{i,2}\;\cdots \;{{x}}_{i,j}] $xid为第i个个体中第d维的初始位置。

    $${{x}}_{i,d}={{l}_d}+{{w}}_{i,d+1}\left({u}_{d}-{l}_{d}\right) $$ (6)

    式中$ {u}_{d} $$ {l}_{d} $分别为第$ d $维搜索范围的上界和下界。

    (2) 螺旋捕食策略。在标准SSA中,跟随者的位置往往容易被发现者的最优位置影响,发现最优位置后,种群会在短时间内向该位置迅速收缩,虽然能提升算法收敛速度,但种群多样性也会在短时间内降低,致使算法的全局搜索能力变弱,大大增加陷入局部最优的概率。针对该问题,将WOA中的螺旋捕食策略引入跟随者的位置更新过程中。螺旋捕食策略是指在鲸鱼与猎物之间创建一个螺旋等式,模仿座头鲸的螺旋状移动[20-21]。该策略既保证了收敛性,又兼顾了种群多样性,能够很好地平衡局部开发和全局搜索能力。改进后跟随者位置更新公式为

    $$ {\boldsymbol{X}}_{i,j}^{t+1}=\left\{\begin{array}{l}Q \mathrm{exp}\left(\dfrac{{\boldsymbol{X}}_{{\rm{worst}}}^{t}-{\boldsymbol{X}}_{i,j}^{t}}{{i}^{2}}\right)\qquad\quad i > \dfrac{q}{2}\\ {\boldsymbol{X}}_{{\rm{p}}}^{t}+{{D}}{{'}} {\exp}({{cv}}) \mathrm{cos}\left(2{\text{π}}v\right)\quad 其他\end{array}\right. $$ (7)

    式中:${{D}}{{'}}$为第$ t $次迭代时麻雀与食物(当前最优解)之间的距离,${D}{{'}}=|\left.{{\boldsymbol{X}}}_{{\rm{p}}}^{t}-{{\boldsymbol{X}}}_{i,j}^{t}|\right.$$ c $为定义螺旋线形状的常数;$v$为[−1,1]的随机值。

    (3) 萤火虫扰动策略。在SSA迭代后期,由于麻雀个体的同化,导致算法易陷入局部最优。针对该问题,采用萤火虫扰动策略对所有麻雀位置进行一次扰动更新,增强其跳出局部最优的能力。萤火虫扰动策略是指根据萤火虫亮度进行移动,从而得到新的位置[22]。扰动后麻雀位置更新公式为

    $$ {\boldsymbol{Y}}_{i,j}^{t+1}={\boldsymbol{X}}_{i,j}^{t+1}+\sigma \left({\boldsymbol{X}}_{i,j}^{t+1}-{\boldsymbol{X}}_{{\rm{p}}}^{t}\right)+\theta \left({{s}}-\dfrac{1}{2}\right) $$ (8)

    式中:$\sigma \mathrm{为}\mathrm{吸}\mathrm{引}\mathrm{度},\sigma ={\sigma }_{0} {\exp}({-\gamma {r}_{i,j}^{2}})$$ {\sigma }_{0}$为最大吸引度,$ \gamma $为光强吸收系数,$ {r}_{i,j}\mathrm{为}{\boldsymbol{X}}_{i,j}^{t+1} $${\boldsymbol{X}}_{{\rm{p}}}^{t}$之间的距离;$ \theta $为步长因子,取值范围为[0,1];$s$为[0,1]上均匀分布的随机数。

    改进后得到的ISSA流程如图7所示。

    图  7  ISSA流程
    Figure  7.  Flow of improved sparrow search algorithm

    基于ISSA−LSTM的浓缩池溢流浓度预测模型如图8所示。

    图  8  基于ISSA−LSTM的浓缩池溢流浓度预测模型
    Figure  8.  Prediction model of overflow concentration of thickener based on ISSA-LSTM

    (1) 对煤泥水浓缩过程监测到的数据集进行预处理,并按照8∶2的比例划分为训练集和测试集。

    (2) 构建双层LSTM网络模型,选择Adam作为学习过程的优化算法[23],采用L2正则化防止模型过拟合。

    (3) 设置优化算法的最大迭代次数tmax、空间维度j、种群规模N及LSTM网络模型的5个超参数,包括2个LSTM层的单元数、迭代次数、初始学习率和L2正则化因子。

    (4) 初始化种群,将麻雀位置映射为超参数的值,以均方根误差作为个体的适应度值。

    (5) 采用ISSA算法寻找最优值,并记录寻找到的位置和适应度值。

    (6) 判断优化算法是否达到最大迭代次数tmax,若达到则输出最优超参数,将其赋予LSTM网络,否则返回步骤(5)。

    (7) 采用输出的超参数构建溢流浓度预测模型,根据输入得到溢流浓度预测值。

    选用均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为ISSA−LSTM溢流浓度预测模型效果的评价标准。RMSE能够描述预测值与实际值的非线性拟合度,值越小,说明预测值越接近实际值;MAPE表示预测值与实际值的平均偏离程度,值越小,说明预测模型精度越高。设RMSE,MAPE的值分别为${\delta }_{{\rm{RMSE}}} $${\delta }_{{\rm{MAPE}}}$,其计算公式为

    $$ {\delta }_{{\rm{RMSE}}}=\sqrt{\frac{1}{W}\sum _{m=1}^{W}{\left({\tilde{p}}_{m}-{p}_{m}\right)}^{2}} $$ (9)
    $${\delta }_{{\rm{MAPE}}}=\frac{1}{W}\sum _{m=1}^{W}\left|\frac{{\tilde{p}}_{m}-{p}_{m}}{{p}_{m}}\right|\times 100{\text{%}} $$ (10)

    式中:$ W $为测试集数据个数;${\tilde{p}}_{m}$为采用ISSA−LSTM模型得到的溢流浓度预测值;$ {p}_{m} $为溢流浓度实测值。

    为验证数据降噪对溢流浓度预测精度的影响,将降噪前后各100组实验数据分别按照8∶2的比例划分训练集与测试集,用ISSA−LSTM预测模型进行对比实验,结果见表2

    表  2  降噪前后预测结果
    Table  2.  Prediction results before and after noise reduction
    实验数据RMSEMAPE/%
    降噪前492.711 532.99
    降噪后55.788 32.74
    下载: 导出CSV 
    | 显示表格

    表2可看出,降噪后实验数据的预测精度更高,RMSE约是降噪前的1/9,MAPE与降噪前相比下降了30.25%。这是由于原始实验数据中存在噪声,直接输入预测模型会导致拟合效果较差,而数据降噪可以降低噪声所占比例,从而使预测精度大幅提升。

    为了验证ISSA的寻优效果,选取Ackley函数和Rastrigin函数作为测试函数,并与PSO算法、WOA及标准SSA进行对比。

    Ackley函数是一种多峰优化算法测试基准函数,存在众多局部最优解和1个全局最优解,如图9所示。可看出Ackley函数的最优解位于中心的孔洞中,周围分布着许多局部极值,孔洞的外部则较为平坦。因此,寻优过程中越靠近中心,越容易陷入局部最优,从而使优化算法难以寻找到全局最优解。Ackley函数表达式为

    $$\begin{split} {F}_{10}\left({x}_{1},{x}_{2},\cdots ,{x}_{n}\right)=&-20\mathrm{exp}\left(-0.2\sqrt{\frac{1}{n}\sum _{k=1}^{n}{x}_{k}^{2}}\right)-\\& \mathrm{exp}\left[\frac{1}{n}\sum _{k=1}^{n}\mathrm{cos}\left(2{\text{π}} {x}_{k}\right)\right]+20+{\rm{e}} \end{split} $$ (11)

    式中:$x_k(k=1,2,\cdots,n)$为自变量,取值范围为[−32,32],定义域内最小值为0;$ n $为函数的维数。

    图  9  Ackley函数
    Figure  9.  Ackley function

    Rastrigin函数同样也是一种具有多个局部极小值的多峰函数,如图10所示。其搜索空间大,且在最优解周围分布着众多不同的局部极值,因此求取全局最优解也相当困难。Rastrigin函数表达式为

    $$ {F}_{9}\left({x}_{1}',{x}_{2}',\cdots ,{x}_{n}'\right)=10n+\sum _{k=1}^{n}\left[{x}_{k}'^{2}-10\mathrm{cos}\left(2{\text{π}} {x}_{k}'\right)\right] $$ (12)

    式中${x}_{k}' $为自变量,取值范围为[−5.12,5.12],定义域内最小值为0。

    图  10  Rastrigin函数
    Figure  10.  Rastrigin function

    测试时,为了去除偶然因素引起的误差,分别对4种优化算法进行20次独立实验,最后结果取平均值。设置最大迭代次数tmax=1 000,维数j=5,测试结果如图11图12所示。

    图  11  不同优化算法的Ackley函数收敛曲线
    Figure  11.  Convergence curves of Ackley function of different optimization algorithms
    图  12  不同优化算法的Rastrigin函数收敛曲线
    Figure  12.  Convergence curves of Rastrigin function of different optimization algorithms

    图11图12可以看出,采用Ackley函数测试时,4种优化算都能够快速收敛,都搜寻到了最小值,其中ISSA最先达到平稳状态,收敛速度最快。采用Rastrigin函数测试时,PSO和WOA都陷入了局部最优且未能跳出;SSA在迭代次数为30~50时陷入1次局部最优并成功跳出,搜寻到全局最优解,说明SSA的性能优于PSO和WOA;ISSA未陷入局部最优,表现出了优秀的全局搜索能力及快速的收敛性,说明ISSA的全局寻优性能和收敛速度均优于PSO、WOA和标准SSA。

    为进一步探索ISSA性能影响因素,采用混沌映射、螺旋捕食、萤火虫扰动中的2种进行寻优对比实验,设置3种改进策略,对应算法分别命名为ISSA1,ISSA2,ISSA3,见表3。实验结果如图13图14所示。

    表  3  SSA改进策略
    Table  3.  Improvement strategies of sparrow search algorithm
    算法混沌映射螺旋捕食萤火虫扰动
    ISSA1
    ISSA2
    ISSA3
    下载: 导出CSV 
    | 显示表格
    图  13  不同改进策略的Ackley函数收敛曲线
    Figure  13.  Convergence curves of Ackley function of different improvement strategies
    图  14  不同改进策略的Rastrigin函数收敛曲线
    Figure  14.  Convergence curves of Rastrigin function of different improvement strategies

    图13图14可知,5种算法都搜索到了最小值,其中ISSA收敛速度最快且未陷入过局部最优,而其他3种改进策略的收敛速度都有不同程度下降,从快到慢依次是ISSA3,ISSA1,ISSA2。在2个测试函数的寻优过程中,ISSA2均明显陷入局部最优,导致收敛速度变慢,说明在SSA后期寻优过程中,物种多样性的降低会使优化算法易陷入局部最优。在Ackley测试函数的收敛曲线上,与ISSA相比,可以明显看到ISSA3陷入过1次局部最优,说明去除萤火虫扰动后,算法的全局搜索能力有所减弱。基于此,可得出螺旋捕食策略对ISSA性能的提升起主导作用,混沌映射和萤火虫扰动策略协调算法的收敛速度和全局搜索能力,进一步提升算法寻优性能。

    基于Matlab R2021a软件搭建LSTM网络,硬件参数见表4

    表  4  设备硬件参数
    Table  4.  Equipment hardware parameters
    设备名称DESKTOP−3ER5HIS
    处理器11th Gen Intel(R) Core(TM)
    i7−11800H @ 2.30 GHz
    机带RAM32.0 GB
    系统类型64位操作系统
    下载: 导出CSV 
    | 显示表格

    设置ISSA种群规模为30,最大迭代次数为100, LSTM网络的超参数设置见表5

    表  5  超参数设置
    Table  5.  Setting of hyperparameters
    超参数设定值
    第1层神经元个数${M}_{1}$[10,150]
    第2层神经元个数${M}_{2}$[10,60]
    初始学习率$ {I}_{1} $[10−5,1]
    L2正则化因子$ {I}_{2} $[10−6,1]
    最大迭代次数$t_{\rm{max}}$400
    下载: 导出CSV 
    | 显示表格

    采用标准SSA和ISSA对LSTM网络的超参数进行寻优,结果如图15所示。

    图  15  适应度曲线对比
    Figure  15.  Comparison of fitness curves

    图15可知,ISSA−LSTM的适应度值比SSA−LSTM小,说明ISSA比SSA具有更强的跳出局部最优的能力,即全局寻优性能更好,并且ISSA收敛速度更快。SSA寻找到的最优超参数:$ {M}_{1}=65 $$ {M}_{2}=10 $$ {I}_{1}=0.074 $$ {I}_{2}=0.003 $。ISSA寻找到的最优超参数:$ {M}_{1}=125,{M}_{2}=10,{I}_{1}=0.068,{I}_{2}=0.064 $

    为验证ISSA−LSTM模型的预测精度,与双层LSTM模型、SSA−LSTM模型及最小二乘支持向量机(Least Squares Support Vector Machines,LSSVM)模型进行对比。双层LSTM模型中,设置最大迭代次数为400,初始学习率为0.02,学习率衰减因子为0.008;SSA−LSTM模型中,设置最大迭代次数为400,种群数量为30,优化算法的最大迭代次数为100;LSSVM模型中,正则化参数和径向基函数(Radial Basis Function,RBF)的参数分别设置为0.5和0.4。不同模型预测结果对比如图16所示,评价指标对比见表6

    图  16  不同模型预测结果对比
    Figure  16.  Comparison of prediction results of different models
    表  6  不同模型评价指标对比
    Table  6.  Comparison of evaluation indicator of different models
    模型RMSEMAPE/%
    ISSA−LSTM55.788 32.74
    SSA−LSTM56.237 03.08
    LSSVM74.490 23.67
    双层LSTM81.259 73.98
    下载: 导出CSV 
    | 显示表格

    图16表6可知,双层LSTM模型的预测误差最大,RMSE和MAPE比ISSA−LSTM模型高25.4714和1.24%,说明超参数对模型的影响较大;LSSVM模型用于长时间序列预测时表现稍差,RMSE和MAPE比ISSA−LSTM模型高18.7019和0.93%;SSA−LSTM模型因为采用SSA进行超参数寻优,RMSE和MAPE分别比双层LSTM模型降低了25.0227和0.9%,但比ISSA−LSTM模型高0.4487和0.34%。ISSA−LSTM模型的RMSE和MAPE的值分别为55.7883和2.74%,均低于其他对比模型,溢流浓度预测精度达97.26%,验证了将ISSA−LSTM模型用于溢流浓度预测的有效性。

    (1) 通过Tent混沌映射、螺旋捕食策略和萤火虫扰动策略改进SSA,增强了SSA跳出局部最优的能力,提高了收敛速度。

    (2) 对比分析发现,从种群初始化、个体更新和整体扰动3个角度出发所提出的改进策略具有互补性,使得ISSA具有更好的收敛性能、整体寻优能力与求解稳定性,3种改进策略对算法的影响程度从大到小为螺旋捕食、混沌映射、萤火虫扰动。

    (3) 采用ISSA优化LSTM的超参数,解决了依靠主观经验取值时存在的欠拟合或过拟合问题。将ISSA−LSTM模型应用于溢流浓度预测中,预测精度达97.26%,高于SSA−LSTM、LSSVM、双层LSTM等模型。

    (4) 数据预处理可以提升模型的精度,降噪后溢流浓度预测精度比降噪前提升了30.25%。

  • 图  1   煤泥水浓缩工艺流程

    Figure  1.   Concentration process flow of coal slurry

    图  2   Spearman相关性分析热力图

    Figure  2.   Thermodynamic diagram of Spearman correlation analysis

    图  3   降噪前后入料流量对比

    Figure  3.   Comparison of feed flow before and after noise reduction

    图  4   降噪前后溢流浓度对比

    Figure  4.   Comparison of overflow concentration before and after noise reduction

    图  5   双层LSTM网络结构

    Figure  5.   Structure of double-layer LSTM network

    图  6   Tent映射混沌值与随机值对比

    Figure  6.   Comparison of chaotic value and random value of Tent map

    图  7   ISSA流程

    Figure  7.   Flow of improved sparrow search algorithm

    图  8   基于ISSA−LSTM的浓缩池溢流浓度预测模型

    Figure  8.   Prediction model of overflow concentration of thickener based on ISSA-LSTM

    图  9   Ackley函数

    Figure  9.   Ackley function

    图  10   Rastrigin函数

    Figure  10.   Rastrigin function

    图  11   不同优化算法的Ackley函数收敛曲线

    Figure  11.   Convergence curves of Ackley function of different optimization algorithms

    图  12   不同优化算法的Rastrigin函数收敛曲线

    Figure  12.   Convergence curves of Rastrigin function of different optimization algorithms

    图  13   不同改进策略的Ackley函数收敛曲线

    Figure  13.   Convergence curves of Ackley function of different improvement strategies

    图  14   不同改进策略的Rastrigin函数收敛曲线

    Figure  14.   Convergence curves of Rastrigin function of different improvement strategies

    图  15   适应度曲线对比

    Figure  15.   Comparison of fitness curves

    图  16   不同模型预测结果对比

    Figure  16.   Comparison of prediction results of different models

    表  1   S−G算法参数

    Table  1   Parameters of S-G algorithm

    参数平滑因子多项式次数
    入料流量0.152
    入料浓度0.101
    加药量0.152
    下载: 导出CSV

    表  2   降噪前后预测结果

    Table  2   Prediction results before and after noise reduction

    实验数据RMSEMAPE/%
    降噪前492.711 532.99
    降噪后55.788 32.74
    下载: 导出CSV

    表  3   SSA改进策略

    Table  3   Improvement strategies of sparrow search algorithm

    算法混沌映射螺旋捕食萤火虫扰动
    ISSA1
    ISSA2
    ISSA3
    下载: 导出CSV

    表  4   设备硬件参数

    Table  4   Equipment hardware parameters

    设备名称DESKTOP−3ER5HIS
    处理器11th Gen Intel(R) Core(TM)
    i7−11800H @ 2.30 GHz
    机带RAM32.0 GB
    系统类型64位操作系统
    下载: 导出CSV

    表  5   超参数设置

    Table  5   Setting of hyperparameters

    超参数设定值
    第1层神经元个数${M}_{1}$[10,150]
    第2层神经元个数${M}_{2}$[10,60]
    初始学习率$ {I}_{1} $[10−5,1]
    L2正则化因子$ {I}_{2} $[10−6,1]
    最大迭代次数$t_{\rm{max}}$400
    下载: 导出CSV

    表  6   不同模型评价指标对比

    Table  6   Comparison of evaluation indicator of different models

    模型RMSEMAPE/%
    ISSA−LSTM55.788 32.74
    SSA−LSTM56.237 03.08
    LSSVM74.490 23.67
    双层LSTM81.259 73.98
    下载: 导出CSV
  • [1] 冯甜欣,张晓光,刘景勇,等. 基于云平台的选煤厂环境监测系统[J]. 工矿自动化,2021,47(10):121-126.

    FENG Tianxin,ZHANG Xiaoguang,LIU Jingyong,et al. Environmental monitoring system of coal preparation plant based on cloud platform[J]. Industry and Mine Automation,2021,47(10):121-126.

    [2] 董永胜,陈为高,侯佃平,等. 智能化选煤厂研究与建议[J]. 工矿自动化,2021,47(增刊1):26-31.

    DONG Yongsheng,CHEN Weigao,HOU Dianping,et al. Research and suggestions on intelligent coal preparation plant[J]. Industry and Mine Automation,2021,47(S1):26-31.

    [3] 李朋,张明远,王保强. 分级破碎机智能化技术现状与发展方向[J]. 煤炭工程,2022,54(1):133-136.

    LI Peng,ZHANG Mingyuan,WANG Baoqiang. Status and development trends of intelligent technology of sizing crusher[J]. Coal Engineering,2022,54(1):133-136.

    [4] 陈铭. 基于深度学习的浮选过程智能控制研究[D]. 徐州: 中国矿业大学, 2020.

    CHEN Ming. Study on the intelligent control of flotation process based on deep learning[D]. Xuzhou: China University of Mining and Technology, 2020.

    [5] 赵毅鑫,杨志良,马斌杰,等. 基于深度学习的大采高工作面矿压预测分析及模型泛化[J]. 煤炭学报,2020,45(1):54-65.

    ZHAO Yixin,YANG Zhiliang,MA Binjie,et al. Deep learning prediction and model generalization of ground pressure for deep longwall face with large mining height[J]. Journal of China Coal Society,2020,45(1):54-65.

    [6] 董丽丽,费城,张翔,等. 基于LSTM神经网络的煤矿突水预测[J]. 煤田地质与勘探,2019,47(2):137-143.

    DONG Lili,FEI Cheng,ZHANG Xiang,et al. Coal mine water inrush prediction based on LSTM neural network[J]. Coal Geology & Exploration,2019,47(2):137-143.

    [7] 刘立邦,杨颂,王志坚,等. 基于改进WOA−LSTM的焦炭质量预测[J]. 化工学报,2022,73(3):1291-1299.

    LIU Libang,YANG Song,WANG Zhijian,et al. Prediction of coke quality based on improved WOA-LSTM[J]. CIESC Journal,2022,73(3):1291-1299.

    [8] 宋刚,张云峰,包芳勋,等. 基于粒子群优化LSTM的股票预测模型[J]. 北京航空航天大学学报,2019,45(12):2533-2542. DOI: 10.13700/j.bh.1001-5965.2019.0388

    SONG Gang,ZHANG Yunfeng,BAO Fangxun,et al. Stock prediction model based on particle swarm optimization LSTM[J]. Journal of Beijing University of Aeronautics and Astronautics,2019,45(12):2533-2542. DOI: 10.13700/j.bh.1001-5965.2019.0388

    [9] 付华,赵俊程,付昱,等. 基于量子粒子群与深度学习的煤矿瓦斯涌出量软测量[J]. 仪器仪表学报,2021,42(4):160-168. DOI: 10.19650/j.cnki.cjsi.J2107486

    FU Hua,ZHAO Juncheng,FU Yu,et al. Soft measurement of coal mine gas emission based on quantum-behaved particle swarm optimization and deep learning[J]. Chinese Journal of Scientific Instrument,2021,42(4):160-168. DOI: 10.19650/j.cnki.cjsi.J2107486

    [10] 吴磊,康英伟. 基于改进粒子群优化长短时记忆神经网络的脱硫系统SO2预测模型[J]. 热力发电,2021,50(12):66-73.

    WU Lei,KANG Yingwei. Prediction model of SO2 concentration in desulfurization system based on improved particle swarm optimization LSTM[J]. Thermal Power Generation,2021,50(12):66-73.

    [11]

    LIU Guiyun,SHU Cong,LIANG Zhongwei,et al. A modified sparrow search algorithm with application in 3D route planning for UAV[J]. Sensors,2021,21(4):1224. DOI: 10.3390/s21041224

    [12]

    ZHU Yanlong,YOUSEFI N. Optimal parameter identification of PEMFC stacks using adaptive sparrow search algorithm[J]. International Journal of Hydrogen Energy,2021,46(14):9541-9552. DOI: 10.1016/j.ijhydene.2020.12.107

    [13] 贾澎涛,苗云风. 基于堆叠LSTM的多源矿压预测模型分析[J]. 矿业研究与开发,2021,41(8):79-82.

    JIA Pengtao,MIAO Yunfeng. Multi-source mine pressure prediction model analysis based on stacked-LSTM[J]. Mining Research and Development,2021,41(8):79-82.

    [14]

    XING Yin,YUE Jianping,CHEN Chuang,et al. Dynamic displacement forecasting of dashuitian landslide in China using variational mode decomposition and stack long short-term memory network[J]. Applied Sciences,2019,9(15):2951-2962. DOI: 10.3390/app9152951

    [15]

    XUE Jiankai,SHEN Bo. A novel swarm intelligence optimization approach:sparrow search algorithm[J]. Systems Science & Control Engineering,2020,8(1):22-34.

    [16] 吕鑫,慕晓冬,张钧. 基于改进麻雀搜索算法的多阈值图像分割[J]. 系统工程与电子技术,2021,43(2):318-327. DOI: 10.12305/j.issn.1001-506X.2021.02.05

    LYU Xin,MU Xiaodong,ZHANG Jun. Multi-threshold image segmentation based on improved sparrow search algorithm[J]. Systems Engineering and Electronics,2021,43(2):318-327. DOI: 10.12305/j.issn.1001-506X.2021.02.05

    [17] 吴新忠,韩正化,魏连江,等. 矿井风流智能按需调控算法与关键技术[J]. 中国矿业大学学报,2021,50(4):725-734. DOI: 10.13247/j.cnki.jcumt.001316

    WU Xinzhong,HAN Zhenghua,WEI Lianjiang,et al. Intelligent on-demand adjustment algorithm and key technology of mine air flow[J]. Journal of China University of Mining & Technology,2021,50(4):725-734. DOI: 10.13247/j.cnki.jcumt.001316

    [18] 滕志军,吕金玲,郭力文,等. 一种基于Tent映射的混合灰狼优化的改进算法[J]. 哈尔滨工业大学学报,2018,50(11):40-49. DOI: 10.11918/j.issn.0367-6234.201806096

    TENG Zhijun,LYU Jinling,GUO Liwen,et al. An improved hybrid grey wolf optimization algorithm based on Tent mapping[J]. Journal of Harbin Institute of Technology,2018,50(11):40-49. DOI: 10.11918/j.issn.0367-6234.201806096

    [19]

    DEMIDOVA L,GORCHAKOV A V. A study of chaotic maps producing symmetric distributions in the fish school search optimization algorithm with exponential step decay[J]. Symmetry,2020,12(5):784-801. DOI: 10.3390/sym12050784

    [20]

    MIRJALILI S,LEWIS A. The whale optimization algorithm[J]. Advances in Engineering Software,2016,95:51-67. DOI: 10.1016/j.advengsoft.2016.01.008

    [21] 孙林,黄金旭,徐久成,等. 基于自适应鲸鱼优化算法和容错邻域粗糙集的特征选择算法[J]. 模式识别与人工智能,2022,35(2):150-165. DOI: 10.16451/j.cnki.issn1003-6059.202202006

    SUN Lin,HUANG Jinxu,XU Jiucheng,et al. Feature selection based on adaptive whale optimization algorithm and fault-tolerance neighborhood rough sets[J]. Pattern Recognition and Artificial Intelligence,2022,35(2):150-165. DOI: 10.16451/j.cnki.issn1003-6059.202202006

    [22] 柳长安,冯雪菱,孙长浩,等. 基于改进麻雀算法的最大2维熵分割方法[J]. 激光技术,2022,46(2):274-282. DOI: 10.7510/jgjs.issn.1001-3806.2022.02.020

    LIU Chang'an,FENG Xueling,SUN Changhao,et al. Maximum two-dimensional entropy segmentation method based on improved sparrow algorithm[J]. Laser Technology,2022,46(2):274-282. DOI: 10.7510/jgjs.issn.1001-3806.2022.02.020

    [23] 曹通,白艳萍. 基于梯度下降优化的LSTM对空气质量预测研究[J]. 陕西科技大学学报,2020,38(6):159-164. DOI: 10.3969/j.issn.1000-5811.2020.06.026

    CAO Tong,BAI Yanping. Study on the prediction of air quality based on LSTM with gradient descent optimization[J]. Journal of Shaanxi University of Science & Technology,2020,38(6):159-164. DOI: 10.3969/j.issn.1000-5811.2020.06.026

  • 期刊类型引用(4)

    1. 王宇飞. 煤泥水智能加药系统的研究现状. 煤炭技术. 2025(04): 287-290 . 百度学术
    2. 王汾青. 选煤场浓缩池溢流浓度控制方法研究. 工业仪表与自动化装置. 2024(01): 83-86+91 . 百度学术
    3. 姜汉国,柴东元,戴恩哲,胡玉. 基于人工智能的大型光伏电站风险预控技术研究. 粘接. 2024(08): 146-149 . 百度学术
    4. 李博,杨小权,乔少利. 选煤厂煤泥水系统智能压滤技术应用研究. 矿业安全与环保. 2024(06): 200-204 . 百度学术

    其他类型引用(6)

图(16)  /  表(6)
计量
  • 文章访问数:  330
  • HTML全文浏览量:  76
  • PDF下载量:  45
  • 被引次数: 10
出版历程
  • 收稿日期:  2022-06-21
  • 修回日期:  2022-10-28
  • 网络出版日期:  2022-08-08
  • 刊出日期:  2022-11-24

目录

/

返回文章
返回