基于LLE-FOA-BP模型的煤与瓦斯突出强度预测

隆能增1,袁梅1,2,3,4,敖选俊5,李鑫灵1,张平1

(1.贵州大学 矿业学院,贵州 贵阳 550025;2.贵州省非金属矿产资源综合利用重点实验室,贵州 贵阳 550025;3.贵州省优势矿产资源高效利用工程实验室,贵州 贵阳 550025;4.复杂地质矿山开采安全技术工程中心,贵州 贵阳 550025;5.贵州中纸投资有限公司,贵州 盘州 553537)

摘要针对目前煤与瓦斯突出强度预测精度低、稳定性差及训练速度慢等问题,提出了一种基于局部线性嵌入法-果蝇优化算法-BP神经网络(LLE-FOA-BP)模型的煤与瓦斯突出强度预测方法。借助LLE算法的非线性数据特征提取优势,提取煤与瓦斯突出影响因素原始数据的本质特征,形成重构有效因子,降低数据间的冗余信息及噪声;利用FOA算法较强的全局寻优能力优化BP神经网络的权值和阈值,避免陷入局部极小,提高参数寻优效率;将重构有效因子输入优化后的BP神经网络进行训练,实现煤与瓦斯突出强度快速、准确预测。测试结果表明,LLE-FOA-BP模型的平均相对误差为8.06%,相对误差的方差为3.69,经过24次迭代训练就达到10-8的训练精度,能够在保证预测精度的基础上,提高鲁棒性和学习效率。

关键词煤与瓦斯突出强度预测;局部线性嵌入;果蝇算法;BP神经网络;大数据处理

0 引言

准确、快速预测工作面煤与瓦斯突出危险性对于防治突出灾害、保障井下作业人员安全具有重要意义。传统的煤与瓦斯突出预测方法有单项指标法、综合指标法、地质指标法等,这些方法都为静态预测,预测机理较为单一,不能全面反映工作面突出危险性,且指标临界值大多根据煤矿统计数据或经验确定,存在预测效果较差及智能化程度低等问题[1-3]

BP神经网络具有较强的非线性映射能力和高度自学习、自适应能力[4],被广泛应用于煤与瓦斯突出预测中。但当数据量过大时BP神经网络存在训练速度较慢、易陷入局部极小等问题。针对训练速度慢的问题,常用的改进方法是通过主成分分析、线性判别法和灰色关联分析等提取数据特征后再输入BP神经网络进行预测,但这3种方法为线性特征提取方式,对本质为非线性分布的煤与瓦斯突出影响因素的特征提取效果较差[5],导致BP神经网络预测精度不高。针对易陷入局部极小的问题,当前广泛使用遗传算法对BP神经网络进行参数寻优,提高其映射能力,但遗传算法存在交叉和变异操作,容易陷入局部最优,且编码方式较为复杂[6],不利于实现煤与瓦斯突出危险性快速、准确预测。

针对以上问题,本文结合LLE(Local Linear Embedding,局部线性嵌入法)和FOA (Fruit fly Optimization Algorithm,果蝇优化算法)对BP神经网络进行改进,利用LLE适用于非线性数据特征提取的特点来提取煤与瓦斯突出影响因素原始样本的本质特征,借助FOA全局参数寻优及初始设定参数少的优势来优化BP神经网络的权值及阈值,实现煤与瓦斯突出强度快速、准确预测。

1 煤与瓦斯突出强度预测模型

1.1 LLE算法

LLE算法用于非线性数据的特征提取,具有参数少、收敛速度快等优点,可将输入的高维数据点映射到全局低维坐标系,且降维后的数据能够较好地保持原有的拓扑结构。其基本思想:在样本空间中,每一个样本点是由许多相互邻接的局部线性点拼凑而成,这种局部线性点概要地描述了高维数据集的本质特征,当高维数据集整体向更低的维度进行嵌入时提取出这种特性,就保留了原有高维数据集的根本特征[7]

LLE算法将由ND维向量组成的原始矩阵XD×N转换为保留原始数据特征的由Nd维向量(d<N)组成的降维矩阵Yd×N,矩阵Y与矩阵X的列向量一一对应。LLE算法步骤如下[8]

(1)构造每个样本点xi(i=1,2,…,N)的K个近邻点。计算某个样本点与其他N-1个样本点之间的欧氏距离,找到xiK个最近邻集合Xi={xi1,xi2,…,xiK}。

(2)对每个样本点xi,计算其被邻域Xi线性重构的系数,重构误差为

(1)

式中:为对xi的线性重构,j为重构后系数矩阵的维数;fijxixij重构的系数矩阵,其表达式为

(2)

式中:G为局部Gram矩阵;h为Gram矩阵中数据本身的几何维度;m为各维度之间的距离。

重构系数对于xi和其邻域点Xi具有旋转、伸缩和不变性,故可以描述邻域的几何结构。

(3)重构系数矩阵fij与原始数据矩阵的内积即为所求的低维重构有效因子,其目标函数为

(3)

式中yiyjxij在低维度上的投影。

为了得到最大程度保持xij内在几何特征的重构有效因子,需加入约束条件I,使得J在一定范围内变动且对应的均方差损失最小。I表达式为

(4)

fij在降维矩阵Y中仍然被保持,可见嵌入结果完全由表征内在几何特征的重构权值决定。通过从高维特征向量向低维特征向量映射,得到新的低维特征向量,在降低数据维数的同时保持了原有的拓扑结构和局部关联性。

1.2 BP神经网络优化

FOA是由潘文超博士在2011年提出的一种新型群智能全局优化算法[9]。该算法是利用果蝇感官较其他生物更加灵敏的特点,以其觅食行为为基础推演得出,与以往的群智能算法(如粒子群算法、蚁群算法等)相比,FOA寻优机制简单易懂[10],初始参数设置少,鲁棒性较强,具有优良的全局优化能力。

FOA优化BP神经网络的原理[11]:将BP神经网络的权值和阈值当作果蝇个体,均方误差函数当作FOA的目标函数,用FOA的迭代寻优代替BP神经网络中的梯度修正;在迭代寻优过程中,通过最优个体位置的改变使误差达到最小,最终确定最优权值和阈值。

1.3 LLE-FOA-BP模型

在Matlab环境中建立一个具有3层拓扑结构的LLE-FOA-BP模型,模型预测流程如图1所示。

图1 LLE-FOA-BP模型预测流程
Fig.1 Prediction process of LLE-FOA-BP model

(1)首先设置LLE算法的近邻点个数K及嵌入维度d。其中K主要根据经验确定,而d值一般在[K-5,K-2]范围内选取,并以1为步长逐个输入模型中进行联合训练,取误差最小的训练网络来确定最优d值。将K值及d值输入LLE算法,求得降维后的重构有效因子。

(2)初始化果蝇群体的位置、规模及最大迭代次数。果蝇搜索最佳参数,通过不断更新BP神经网络的权值和阈值来在线寻找气味浓度最佳的果蝇位置。根据适应度函数计算气味浓度,记录气味浓度最大值及其对应的最佳位置。

(3)果蝇算法在寻求最佳位置时需同时满足3个结束条件:达到最大迭代次数,优化参数收敛,达到预设精度。若得出的解符合这3个条件则迭代停止,否则转到步骤 (2)。

(4)将FOA寻找到的最优权值和阈值输入BP神经网络,不断调整BP神经网络中隐含层节点数和各训练函数,最后选取训练误差最小的网络进行煤与瓦斯突出强度预测。

2 实例应用

2.1 煤与瓦斯突出影响因素

煤与瓦斯突出强度主要受瓦斯压力、煤体物理力学性质及地应力等复杂因素影响[12]。在进行煤与瓦斯突出强度预测时,致灾因素的选取影响整个模型的收敛性及准确性。

根据贵州省盘江矿区某煤矿历年突出事故统计资料,结合该矿区突出特性的相关研究[13],建立综合反映煤与瓦斯突出强度各影响因素相互作用机理的4个一级指标:瓦斯指标、煤体物理力学性质指标、煤层及地质构造指标、地应力及开采扰动指标。每个一级指标包含3个二级指标,瓦斯指标的二级指标:煤层原始瓦斯含量A1、煤层瓦斯压力A2及相对瓦斯涌出量A3;煤体物理力学性质指标的二级指标:瓦斯放散初速度A4、煤层普氏系数A5及煤体破坏类型A6;煤层及地质构造指标的二级指标:煤层厚度A7、煤层倾角A8及构造复杂度A9;地应力及开采扰动指标的二级指标:最大主应力A10、开采深度A11及采高A12

根据《煤与瓦斯突出矿井鉴定规范》,煤体破坏类型可分为Ⅰ—Ⅴ,依次用1~5表示;构造复杂度按煤层断层、褶皱、节理等方面的复杂程度划分为4类,即简单构造、一般构造、较复杂构造和极其复杂构造,依次用1~4表示。这些影响因素复杂多变,数据量大,各因素之间又相互作用,组成一个非线性复杂系统,共同影响煤与瓦斯突出的发生。

搜集上述12个因素的实测数据作为LLE-FOA-BP模型的输入样本(表1),对煤与瓦斯突出强度T进行预测。

2.2 LLE算法特征提取过程

选取样本中的前30组原始数据作为训练集,后10组为测试集,输入LLE-FOA-BP模型中进行联合训练和预测。首先要确定LLE算法中Kd的值。K值的选取在算法中起到关键作用,如果K值太小,则提取出的数据不能很好地保持原始数据的本质特征,反之若K值太大,则得到的新因子不能体现局部特性。本文中取经验数值,即K=11。根据Kd的关系可知d的取值范围为6~9,将d值输入BP神经网络模型中进行模拟,经过对比发现,当d=7时预测效果最好。由每个样本点的近邻点计算出该样本点的局部重建权值矩阵fij,根据fij计算得出在低维空间保持12维原始样本点内在几何结构的7维重构有效因子PPP1P7构成,见表2。

表1 煤与瓦斯突出影响因素原始数据
Table 1 Raw data of influencing factors of coal and gas outburst

序号T/tA1/(m3·t-1)A2/MPaA3/(m3·t-1)A4/(mL·s-1)A5A6A7/mA8/(°)A9A10/MPaA11/mA12/m1686.180.434.569.350.3432.512219.44112.521285.220.564.0212.660.5632.313322.54182.331333.780.484.7717.620.4342.214323.74362.241425.790.604.5619.540.5332.613220.34392.6︙︙︙︙︙︙︙︙︙︙︙︙︙︙37975.080.494.378.150.2222.913223.54402.9382246.450.736.2417.220.3633.513426.46213.5392298.550.755.9615.840.4844.215422.35444.0401896.550.654.9313.700.3333.817320.24923.8

表2 重构有效因子
Table 2 Effective reconstruction factors

序号P1P2P3P4P5P6P71-0.241.76-1.29-1.56-3.31-1.55-0.912-0.281.78-0.40-0.54-0.50-1.65-0.953-0.59-0.051.360.461.16-1.51-0.974-0.300.052.130.09-0.81-1.32-0.95︙︙︙︙︙︙︙︙270.78-2.50-0.93-0.22-2.50-0.91-0.94280.71-0.43-0.221.050.10-0.27-0.99292.89-1.38-1.841.450.09-0.24-0.9930-2.070.100.500.640.08-0.07-1.00

2.3 BP神经网络训练及FOA参数寻优

将重构有效因子归一化处理至[-1,1],作为BP神经网络的输入层变量,T作为输出值,根据式(5)确定隐含层节点数q

(5)

式中:n为输入层个数;c为输出层个数;a为0~10的整数。

而12维的煤与瓦斯突出影响因素原始数据经LLE算法降维后得到保留其内在几何结构的7维重构有效因子,故BP神经网络的输入节点为7;由于本文只需对煤与瓦斯突出强度进行预测,故输出节点为1。故隐含层节点数的取值范围为[3,13]。原始隐含层神经元传递函数采用S型正切函数tansig,输出层神经元传递函数采用线性传递函数purelin。考虑到煤与瓦斯突出预测具有快速性要求,故选择收敛速度最快的LM算法(最速下降法)作为训练函数,设置最大训练次数为5 000,训练速率为0.01,训练精度为10-6

果蝇种群位置范围为[1,2],种群规模为30,最大迭代次数为100,迭代到24代左右找到了全局最优的BP神经网络的输入权值和隐含层偏差。通过测试得到隐含层节点个数为13时训练误差最小,因此设隐含层节点个数为13。建立具有7个输入层节点、13个隐含层节点和1个输出节点的BP神经网络,进行煤与瓦斯突出强度预测。

2.4 预测结果分析

将表1中的数据输入BP神经网络模型、FOA-BP神经网络模型、LLE-FOA-BP模型进行煤与瓦斯突出强度预测,预测结果见表3。

从表3可以得出,3种模型的平均相对误差都在可接受范围内,表明利用BP神经网络进行煤与瓦斯突出强度预测是可行的。其中LLE-FOA-BP模型的平均相对误差最小,为8.06%。3种模型的预测效果如图2所示。从图2可看出,LLE-FOA-BP模型的预测值与实际值拟合程度最高。

图2 3种模型的预测效果
Fig.2 Prediction effects of three models

表3 BP,FOA-BP 和LLE-FOA-BP模型的煤与瓦斯突出强度预测结果
Table 3 Prediction results of coal and gas outburst intensity of BP,FOA-BP and LLE-FOA-BP model

样本序号实际值/tBP神经网络模型FOA-BP神经网络模型LLE-FOA-BP模型预测值/t相对误差/%预测值/t相对误差/%预测值/t相对误差/%11921983.1316713.021768.33222618418.5819314.602087.96323228623.2827819.832147.76439346919.3445816.544155.60561671616.2367810.066434.3866236443.376565.306819.3172292261.312456.992098.7389711720.6211215.4610710.31922418816.072469.822407.141018921815.341719.5216811.11平均值13.7312.118.06方差58.2218.663.69

数据方差是衡量一组数据波动性大小的量,数据方差越大,表明该组数据的波动越大,越不稳定。从表3可以得出,虽然BP神经网络模型在一些点的预测精度高于FOA-BP神经网络模型及LLE-FOA-BP模型,但相对误差的波动性较大,预测结果不稳定,存在较大的偶然性;LLE-FOA-BP模型相对误差的方差最小,为3.69,波动性大大降低,说明FOA算法优化了BP神经网络各层之间的连接结构,提高了最优权值与阈值的搜索效率,增强了BP神经网络的鲁棒性。

在训练速度方面,BP神经网络模型和FOA-BP神经网络模型分别经过289次和123次迭代训练达到10-6的预设训练精度,而LLE-FOA-BP模型经过24次迭代训练就达到10-8的训练精度,超出了预期训练效果,表明用LLE算法进行煤与瓦斯突出影响因素特征提取效果良好,能够较好地保留影响原始数据的本质特征,减少数据间的冗余信息及噪声,在保证预测精度的前提下缩减数据维度,从而提高BP神经网络的学习效率。

3 结论

(1)利用BP神经网络较强的非线性映射及高度自学习能力进行煤与瓦斯突出强度预测。测试结果表明,BP神经网络模型、FOA-BP神经网络模型、LLE-FOA-BP模型的平均相对误差均在14%以下,证明将BP神经网络应用于煤与瓦斯突出强度预测是可行的。

(2)借助LLE算法非线性数据特征提取的优势,对煤与瓦斯突出影响因素的原始数据进行维数约减,形成重构有效因子,减少数据间的冗余信息及噪声。测试结果表明,LLE-FOA-BP模型经过24次迭代训练就达到10-8的训练精度,提高了BP神经网络的学习效率。

(3)利用FOA算法较强的全局寻优能力优化BP神经网络权值及阈值,避免陷入局部极小。测试结果表明,LLE-FOA-BP模型相对误差的方差最小,为3.69,波动性大大降低,增强了BP神经网络的鲁棒性。

(4)LLE-FOA-BP模型的相对误差最小,为8.06%,优于BP神经网络模型和FOA-BP神经网络模型。在LLE算法特征提取及FOA算法全局寻优的双重优化下,LLE-FOA-BP模型能够在保证预测精度的基础上,提高学习效率。在海量非线性数据处理方面,LLE-FOA-BP模型的预测效果将更加明显,对于促进煤矿企业大数据处理和数据挖掘技术的发展具有一定的意义。

参考文献(References):

[1] 张宏伟,李胜.煤与瓦斯突出危险性的模式识别和概率预测[J].岩石力学与工程学报,2005,24(19):3577-3581.

ZHANG Hongwei,LI Sheng.Pattern recognition and possibility prediction of coal and gas outburst[J].Chinese Journal of Rock Mechanics and Engineering,2005,24(19):3577-3581.

[2] 李胜,罗明坤,范超军,等.采煤工作面煤与瓦斯突出危险性智能判识技术[J].中国安全科学学报,2016,26(10):76-81.

LI Sheng,LUO Mingkun,FAN Chaojun,et al.Research on coal and gas outburst risk intelligent recognition in mining face[J].China Safety Science Journal,2016,26(10):76-81.

[3] 朱志洁,张宏伟,韩军,等.基于PCA-BP神经网络的煤与瓦斯突出预测研究[J].中国安全科学学报,2013,23(4):45-50.

ZHU Zhijie,ZHANG Hongwei,HAN Jun,et al.Prediction of coal and gas outburst based on PCA-BP neural network[J].China Safety Science Journal,2013,23(4):45-50.

[4] 李朝静,唐幼纯,黄霞.BP神经网络的应用综述[J].劳动保障世界(理论版),2012(8):71-74.

[5] 马宇.基于高维空间的非线性降维的局部线性嵌入LLE方法[D].成都:西南交通大学,2017.

[6] 程加堂,艾莉,徐绍坤.基于MMAS-BP的煤与瓦斯突出强度预测[J].中国安全科学学报,2011,21(9):77-81.

CHENG Jiatang,AI Li,XU Shaokun.Prediction of coal and gas outburst intensity based on MMAS-BP[J].China Safety Science Journal,2011,21(9):77-81.

[7] 律方成,张波.基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别[J].电测与仪表,2014,51(15):37-41.

LYU Fangcheng,ZHANG Bo.Pattern recognition of GIS discharge types based on LLE dimensionality reduction and BP_Adaboost classifier[J].Electrical Measurement &Instrumentation,2014,51(15):37-41.

[8] 李心杰,贾进章.基于LLE-ELM的矿井瓦斯涌出量预测方法研究[J].工业安全与环保,2015,41(7):8-11.

LI Xinjie,JIA Jinzhang.Prediction method of mine gas emission based on LLE-ELM[J].Industrial Safety and Environmental Protection,2015,41(7):8-11.

[9] 杨帆,王小兵,邵阳.改进型果蝇算法优化的灰色神经网络变形预测[J].测绘科学,2018,43(2):63-69.

YANG Fan,WANG Xiaobing,SHAO Yang.Deformation prediction of grey neural network based on modified fruit fly algorithm[J].Science of Surveying and Mapping,2018,43(2):63-69.

[10] 杨刚,王建民.基于改进果蝇优化BP神经网络的磨矿粒度软测量[J].仪表技术与传感器,2018(8):122-126.

YANG Gang,WANG Jianmin.Soft measurement of grinding size based on modified fruit fly algorithm to optimize BP neural network[J].Instrument Technique and Sensor,2018(8):122-126.

[11] 高洪香.宁夏黄土丘陵区水资源需求预测研究[D].银川:宁夏大学,2013.

[12] 付华,王馨蕊,王志军,等.基于PCA和PSO-ELM的煤与瓦斯突出软测量研究[J].传感技术学报,2014,27(12):1710-1715.

FU Hua,WANG Xinrui,WANG Zhijun,et al.Research on the soft sensor of coal and gas outburst based on PCA and PSO-ELM[J].Chinese Journal of Sensors and Actuators,2014,27(12):1710-1715.

[13] 李绍泉.近距离煤层群煤与瓦斯突出机理及预警研究[D].北京:中国矿业大学(北京),2013.

[14] AQ 1024—2006煤与瓦斯突出矿井鉴定规范[S].

Prediction of coal and gas outburst intensity based on LLE-FOA-BP model

LONG Nengzeng1,YUAN Mei1,2,3,4,AO Xuanjun5,LI Xinling1,ZHANG Ping1

(1.Mining College,Guizhou University,Guiyang 550025,China;2.Guizhou Key Laboratory of Comprehensive Utilization of Non-metallic Mineral Resources,Guiyang 550025,China;3.Guizhou Engineering Lab of Advantage Mineral Resources Efficient Utilization,Guiyang 550025,China;4.Engineering Center for Safe Mining Technology under Complex Geologic Conditions,Guiyang 550025,China;5.Guizhou Zhongzhi Investment Co.,Ltd.,Panzhou 553537,China)

AbstractIn view of problems of low prediction accuracy,poor stability and slow training of current coal and gas outburst intensity prediction,a prediction method of coal and gas outburst intensity based on LLE-FOA-BP model was proposed.Essential characteristics of raw data of coal and gas outburst influencing factors are extracted taking use of the advantage of nonlinear data feature extraction of LLE algorithm,effective reconstruction factors are formed,and redundant information and noise between data are reduced.The weight and threshold of BP neural network are optimized by using FOA algorithm's strong global optimization ability to avoid falling into local minima and improve parameter optimization efficiency.Effective reconstruction factors are input into the optimized BP neural network for training,so as to realize quick and accurate prediction of coal and gas outburst intensity.The test results show that the average relative error of LLE-FOA-BP model is 8.06%,variance of relative error is 3.69,and training accuracy of 10-8is achieved after 24 iterations,which verifies the model can improve robustness and learning efficiency while ensuring prediction accuracy.

Key words:prediction of coal and gas outburst intensity;local linear embedding;fruit fly optimization algorithm;BP neural network;big date process

文章编号1671-251X(2019)10-0068-06

DOI:10.13272/j.issn.1671-251x.2019010054

收稿日期:2019-01-14;修回日期:2019-09-20;

责任编辑:胡娴。

基金项目:贵州省科技计划项目(黔科合支撑[2018]2789)。

作者简介:隆能增(1993-),男,广西崇左人,硕士研究生,研究方向为矿山灾害防治,E-mail:565825819@qq.com。

通信作者:袁梅(1973-),女,贵州贵阳人,教授,博士,主要从事安全科学与工程方面的教学及科研工作,E-mail:gutyuanmei@126.com。

引用格式:隆能增,袁梅,敖选俊,等.基于LLE-FOA-BP模型的煤与瓦斯突出强度预测[J].工矿自动化,2019,45(10):68-73.

LONG Nengzeng,YUAN Mei,AO Xuanjun,et al.Prediction of coal and gas outburst intensity based on LLE-FOA-BP model[J].Industry and Mine Automation,2019,45(10):68-73.

中图分类号:TD713

文献标志码:A