Fault diagnosis method for mine hoisting motor based on VMD and CNN-BiLSTM
-
摘要: 针对传统基于音频信号的电动机故障诊断方法获取电动机音频信号特征信息不足和故障诊断精度不高的问题,提出了一种基于优化的变分模态分解(VMD)和卷积神经网络CNN−双向长短期记忆(BiLSTM)的矿井提升电动机故障诊断方法。针对模态混叠和端点效应问题,采用鲸鱼算法(WOA)优化的VMD对电动机音频信号进行分解,将电动机音频信号分解为K个本征模态分量(IMF),经Pearson相关系数筛选后,提取主IMF分量的13维静态MFCC特征参数,为了获取信号的动态特征,提取13维静态MFCC的一阶差分和二阶差分系数,构成39维特征向量,从而把动静态特征结合起来,提高故障诊断性能。为了提高故障诊断精度,在CNN中引入BiLSTM层,CNN在空间维度上提取音频信号的局部特征,BiLSTM在时间维度上保留音频信号的双向时间序列信息,捕获音频信号长距离依赖关系,从而最大程度保留全局和局部特征。实验结果表明:① VMD分解的每个IMF分量都具有独立的中心频率且分布均匀,在频域上表现出稀疏性的特点,能够有效避免模态混叠问题;在IMF求解中,VMD分解通过镜像延拓的方式避免了经验模态分解(EMD)和集合经验模态分解(EEMD)中出现的端点效应问题。② 基于13维静态MFCC特征的故障诊断准确率为97.5%,基于39维动静态MFCC特征的故障诊断准确率比基于13维静态MFCC特征的故障诊断准确率提高了1.11%。③基于CNN−BiLSTM诊断模型的准确率达到98.61%,与目前通用诊断模型CNN,BiLSTM和CNN−LSTM相比,准确率分别提高5.83%,4.17%和3.89%。
-
关键词:
- 矿井提升电动机故障诊断 /
- 音频信号 /
- 变分模态分解 /
- 梅尔倒谱系数 /
- CNN−BiLSTM
Abstract: The traditional motor fault diagnosis method based on the audio signal is insufficient to obtain the feature information of the motor audio signal and the fault diagnosis precision is not high. In order to solve the above problems, a mine motor fault diagnosis method based on optimized variational mode decomposition (VMD) and convolutional neural network CNN bidirectional long short-term memory (BiLSTM) is proposed. The whale algorithm (WOA) optimized VMD is used to decompose the motor audio signal to address the issues of modal aliasing and endpoint effects. The motor audio signal is decomposed into K intrinsic mode functions (IMF). After Pearson correlation coefficient screening, the 13-dimensional static MFCC feature parameters of the main IMF component are extracted. In order to obtain the dynamic features of the signal, the first and second-order difference coefficients of the 13-dimensional static MFCC are extracted to form a 39-dimensional feature vector. By combining dynamic and static features, the performance of fault diagnosis can be improved. In order to improve the precision of fault diagnosis, a BiLSTM layer is introduced into the CNN. The CNN extracts local features of the audio signal in the spatial dimension. The BiLSTM preserves bidirectional time series information of the audio signal in the temporal dimension. It captures long-distance dependencies of the audio signal, thereby maximizing the preservation of global and local features. The experimental results show the following points. ① Each IMF component of VMD decomposition has an independent center frequency and uniform distribution, and exhibits sparsity in the frequency domain. It can effectively avoid modal aliasing problems. In IMF solving, VMD decomposition avoids endpoint effects in empirical mode decomposition (EMD) and ensemble empirical mode decomposition (EEMD) through mirror extension. ② The fault diagnosis accuracy based on 13-dimensional static MFCC features is 97.5%. The fault diagnosis accuracy based on 39-dimensional dynamic and static MFCC features is 1.11% higher than that based on 13-dimensional static MFCC features. ③ The accuracy of the diagnostic model based on CNN-BiLSTM reaches 98.61%, which is 5.83%, 4.17%, and 3.89% higher than the current universal diagnostic models CNN, BiLSTM, and CNN-LSTM, respectively. -
0. 引言
矿井提升机安全稳定运行是保障煤炭高效生产的关键[1]。电动机作为矿井提升机的核心部件,一旦出现故障,严重影响矿井提升机正常工作。因此,对矿井提升电动机进行故障诊断具有重要意义。
目前,电动机故障主要通过监测振动信号和音频信号进行诊断分析[2]。音频信号作为振动信号的同源信号,可通过非接触方式采集,传感器安装便捷,且频带比振动信号宽,含有大量设备运行状态和早期故障信息[3],近年来,基于音频信号处理的电动机故障诊断逐渐成为研究热点。文献[4]提出采用经验模态分解(Empirical Mode Decomposition,EMD)算法对电动机音频信号进行分解,提取各模态分量的能量作为特征进行故障诊断,但EMD分解存在模态混叠和端点效应问题,相邻模态分量波形混叠难以辨别,降低了提取特征对电动机故障的表征能力。文献[5]提出采用集合经验模态分解(Eensemble Empirical Mode Decomposition,EEMD)和Hilbert结合的方法,对峭度准则筛选后的模态分量进行信号重构,通过Hilbert变换提取故障信息,但EEMD分解中加入的白噪声无法完全消除,增大了重构误差。文献[6]提出利用变分模态分解(Varitional Mode Decomposition,VMD)结合相关系数准则提高音频信号信噪比,避免模态混叠和端点效应问题,但VMD分解需要预设模态分量的个数。因此,本文选取优化的VMD对电动机音频信号进行提取。
基于音频信号的电动机故障诊断需要对分析处理后的音频信号进行故障辨识[7]。文献[8]设计了一种基于音频信号的一维卷积神经网络(Converlution Neural Network,CNN),对电动机进行故障诊断,在一定程度上提高了数据集的泛化能力,但是CNN感受野有限,很难捕获全局信息。文献[9]利用长短期记忆(Long Short-Term Memory,LSTM)神经网络对风力发电机齿轮箱进行故障诊断,但LSTM网络限制了模型的并行能力,存在诊断时间较长的缺陷。文献[10]建立了基于CNN−LSTM的风电机组异常状态检测模型,可提前发现机组早期故障,但未优化的复杂网络结构难以训练,甚至会出现退化问题。
为了充分提取电动机音频信号的特征,提高矿井提升电动机故障诊断精度,基于上述研究成果,本文提出一种基于优化VMD和CNN-BiLSTM(Bi-directional Long Short -Term Memory,双向长短期记忆)的矿井提升电动机故障诊断方法。使用鲸鱼算法(Whale Optimization Algorithm,WOA)优化的VMD对电动机音频信号进行分解,有效避免了模态混叠和端点效应问题[11]。同时,在CNN中引入BiLSTM层,使网络结构能够最大程度保留全局和局部特征,提高故障诊断准确率。
1. 音频信号特征提取
1.1 WOA优化VMD
传统VMD[12]分解信号主要分为2个步骤:
1) 构造变分模型将信号分解问题转换成一个有约束最优化的问题。
$$ \begin{split} & \mathop {\min }\limits_{\{ {u_k}\} ,\{ {w _k}\} } \left\{ {\sum\limits_{k=1}^K {\left\| {{\partial _t}\left[ {\left( {\delta (t) + \frac{{\rm{j}}}{{{\text{π}} t}}} \right) * {u_k}(t)} \right]\exp ( - {\rm{j}}{w_k}{{t) }}} \right\|} _2^2} \right\} \\& {\text{s}}{\text{.t}}{\text{.}}\sum\limits_{k = 1}^K {{u_k}(t) = f(t){\text{ }}} \end{split} $$ (1) 式中:$ {u_k} $为各模态函数;$ {w_k} $为各中心频率;K为模态总个数;$ {\partial _t} $为梯度运算;t为时间;$ \delta (t) $为狄克拉函数;*为卷积符号;$ f(t) $为输入信号。
2) 引入二次惩罚因子$ \alpha $和拉格朗日算子$ \lambda $,将有约束最优化的问题转换成无约束最优化的问题。VMD算法将信号分解为指定个数的本征态分量(Intrinsic Mode Function,IMF),每个IMF都具有独立的中心频率,且频域上表现出稀疏性特征。
$$ \begin{split} & {\text{ }}L\left( {\left\{ {{u_k}} \right\},\left\{ {{w_k}} \right\},\lambda } \right) = \\& {\text{ }}\alpha \sum\limits_k {\left\| {{\partial _t}\left[ {\left( {\delta (t) + \frac{{\rm{j}}}{{{\text{π}} t}}} \right) * {u_k}(t)} \right]\exp ( - {\rm{j}}{w_k}{{t) }}} \right\|_2^2} + \\& {\text{ }}\left\| {f(t) - \sum\limits_k {{u_k}(t)} } \right\|_2^2 + \left\langle {\lambda (t),f(t) - \sum\limits_k {{u_k}(t)} } \right\rangle \end{split} $$ (2) 式中L为拉格朗日变换。
模态总个数K和惩罚系数$ \alpha $的设定对VMD的分解效果至关重要,K值过大或过小会引起过分解或欠分解的问题,$ \alpha $值决定着IMF分量的带宽。通常由研究者根据经验知识来选取K和$ \alpha $值,但不够精确。因此,本文利用WOA[13]优化VMD参数。WOA是一种模拟座头鲸狩猎行为的元启发式群体智能优化算法,操作简单,调整的参数少,跳出局部最优的能力强。
WOA算法流程如下:
1) 初始化鲸鱼种群个体的大小、位置、迭代次数等参数。
2) 假设当前最优候选解是目标猎物,鲸鱼个体以50%的概率随机选择收缩包围或螺旋路径向最优位置不断靠近,鲸鱼位置更新公式为
$$ \left\{ \begin{array}{l} D=\left|C {X}^{\ast }(r)-X(r)\right|\\ X(r+1)={X}^{\ast }\left(r\right)-A D \quad p < 0.5 \end{array} \right. $$ (3) $$ \left\{ \begin{array}{l} {D}^{\prime }=\left|{X}^{\ast }(r)-X(r)\right|\\ X(r+1)={D}^{\prime } \mathrm{exp}\left(bl\right) \mathrm{cos}(2{\text{π}} l)\text+{X}^{\ast }\left(r\right) \quad p \geqslant 0.5 \end{array} \right. $$ (4) $$ a = 2 - 2\left( {r/{R_{\max }}} \right) $$ (5) $$ A = 2as - a $$ (6) $$ C = 2s $$ (7) 式中:$ D $为收缩包围猎物时鲸鱼个体到最佳鲸鱼位置的距离;$ D' $为螺旋包围猎物时鲸鱼个体位置到最佳鲸鱼位置的距离;C为摆动因子;$ {X^ * }(r) $为当前最佳鲸鱼位置;$ r $为当前迭代次数;$ X(r) $为当前鲸鱼个体位置;A为收敛因子;$ p $为捕食机制概率,一般取0.5;b为对数螺旋形状的常数;$ l $为(−1,1)的随机数;$ a{\text{ }} $为控制系数,在搜索的过程中,随着迭代次数的增加,a由2减小到0;$ {R_{\max }} $为最大迭代次数;s为(0,1)的随机数。
3) 当$ \left| A \right| \geqslant 1 $时,随机选择一个搜索代理,根据随机选择的鲸鱼位置来更新其他鲸鱼位置,迫使鲸鱼偏离猎物,借此找到一个更合适的猎物,这样可以加强算法的勘探能力,使WOA进行全局搜索,鲸鱼位置为
$$ \left\{ \begin{array}{l}{D}^{''}=\left|C {X}_{{\rm{rand}}}\left(r\right)-X\left(r\right)\right|\\ X(r+1)={X}_{{\rm{rand}}}\left(r\right)-A D\end{array}\right. $$ (8) 式中:$ D'' $为随机搜索时鲸鱼个体位置到最佳鲸鱼位置的距离;$ {X_{{\rm{rand}}}} $为种群中随机选取的鲸鱼个体位置。
4) 达到最大迭代次数,算法终止。使用WOA求解VMD最优参数K和$ \alpha $,选择合适的适应度函数是参数优化的关键。包络熵反映了原始信号的稀疏特性[14],得到的包络值越大,则分量信号中的特征信息越少;得到的包络熵越小,则分量信号中的特征信息越多。因此,本文以包络熵极小值作为适应度函数。信号的包络熵为
$$ \left\{ \begin{gathered} {q_k} = h\left( k \right) \Bigg /\sum\limits_{k = 1}^K {h\left( k \right)} \\ {E_q} = - \sum\limits_{k = 1}^K {{q_k}} \lg {q_k} \\ \end{gathered} \right. $$ (9) 式中:$ {q_k} $为归一化的概率分布序列;$ h\left( k \right) $为经过Hilbert解调后的包络信号;$ {E_q} $为信号的包络熵。
利用WOA对VMD进行寻优,计算流程如图1所示。鲸鱼捕猎方法主要包括随机搜索、螺旋式包围和收缩包围,首先设置鲸鱼种群初始参数和位置信息,计算每条鲸鱼的适应度,找到当前最优位置并保留;然后判断$\left| A \right| $的大小,若$ \left| A \right| \geqslant 1 $,鲸鱼种群扩大搜索范围,按式(8)更新群体位置,若$ \left| A \right| < 1 $,根据p值的大小按式(3)和式(4)更新鲸鱼个体位置,采取收缩包围或螺旋式包围进行捕猎;最后判断是否满足终止条件,如果满足,计算结束,否则进行下一次迭代。
1.2 MFCC特征提取
MFCC(Mel-scale Frequency Cepstral Coefficients,梅尔倒谱系数)是基于人耳听觉特性提出来的,利用Mel频率与采样频率之间的非线性关系计算得到的频谱特征[15-17]。本文对VMD分解后的主IMF分量进行13维MFCC特征参数提取;为了获取信号的动态特征,提取MFCC的一阶差分和二阶差分系数,构成39维特征向量,把动静态特征结合起来,以提高系统的诊断性能。MFCC特征提取流程如图2所示。
具体步骤如下:
1) 筛选主IMF分量。滤波降噪后的音频信号经VMD分解为K个IMF分量,不同故障对应的音频信号频率范围不同,则IMF分量的个数也不同,各个分量中包含原始信号的故障信息的多少也不同,利用Pearson相关系数筛选与原始音频信号相关性大的主IMF分量进行特征提取。Pearson相关系数为
$$ \rho (x,y) = \frac{{{{{v}}} (x,y)}}{{\sigma (x) \sigma (y)}} $$ (10) 式中:$ x $为模态分量信号;$ y $为原始音频信号;$ {{{v}}} (x,y) $为信号$ x $和$ y $的协方差;$ \sigma (x) $为信号$ x $的标准差;$ \sigma (y) $为信号$ y $的标准差。
2) 13维MFCC特征参数提取。对各主IMF分量进行预加重、分帧、加窗、快速傅里叶变换、Mel滤波和离散余弦变换,分别提取13维MFCC特征参数[18]。
3) MFCC一阶差分和二阶差分系数特征提取。由于语音信号是时域连续的,分帧提取的特征信息只反映了本帧语音的特性,为了使特征更能体现时域连续性,对MFCC进行一阶差分和二阶差分特征提取,获取音频信号的动态特征。一阶差分计算公式为
$$d(m)=\frac{\displaystyle \sum\limits_{n=-N}^N n \cdot c_{m+n}}{ \displaystyle \sum\limits_{n=-N}^N n^2} $$ (11) 式中:$ d\left( m \right) $为第m帧差分系数;n为差分计算的帧数;N为差分计算的总帧数,N=[−2,2];$ {c_{m + n}} $为第m+n帧MFCC系数。
将一阶差分系数代入式(10),可得到二阶差分系数。
2. 故障诊断模型及优化
设计的CNN−BiLSTM故障诊断模型如图3所示,其中,Vt−1,Vt,Vt+1分别为t−1,t,t+1时刻的隐藏状态,φt−1,φt,φt+1分别为t−1,t,t+1时刻的输入,βt−1,βt,βt+1分别为t−1,t,t+1时刻的输出。该模型由CNN层、BiLSTM层、全连接层和输出层组成,CNN层由卷积层和最大池化层堆积组成,通过卷积层提取电动机音频信号的MFCC空间特征,引入BiLSTM模型提取降维数据的时间特征,结合CNN的局部相关性和BiLSTM的全局相关性,全面捕获音频数据的特征信息,提高对电动机的故障诊断准确率。
2.1 BiLSTM模型优化CNN
CNN由输入层、卷积层、激活函数、池化层和全连接层组成[19]。传统CNN使用卷积核对输入数据作卷积操作,学习到的特征对应的区域有限,难以获取全局信息。因此,本文在池化层和全连接层之间增加BiLSTM层,以捕获音频信号长距离依赖关系。将多维MFCC特征向量作为输入层,卷积层提取MFCC的空间特征,其中ReLU函数用来增加神经网络的非线性和稀疏性,池化层通过池化来降低卷积层输出的特征向量维度,不易出现过拟合,BiLSTM层由一个前向传播LSTM和一个反向传播LSTM组成[20],能够更加深入提取原始序列的深层特征,全连接层用于连接所有的特征,将输出值送给Softmax分类器。
2.2 模型结构参数
卷积层的数据边界填充方式为“same”,池化方式为最大池化,采用Adam随机优化算法对网络进行训练,设置网络学习率为0.001,迭代次数为600次。模型结构相关参数见表1。
表 1 各网络层参数Table 1. Parameters of each network layer网络层 主要参数 卷积层1 核大小:$ 5 \times 1 $,数量:32,步长:1 池化层1 核大小:$ 2 \times 1 $,步长:1 卷积层2 核大小:$ 3 \times 1 $,数量:64,步长:1 池化层2 核大小:$ 2 \times 1 $,步长:1 BiLSTM层 单元数:5 全连接层 — Softmax层 — 3. 实验与分析
3.1 数据采集
通过MAX9814型麦克风对淮南某煤矿型号为TDBS−5300−20的矿井提升交流同步电动机进行音频信号采集,分别采集电动机正常状态、电流故障、机械故障、超载故障4种状态音频信号,每种信号取300个样本。音频信号处理和模型框架软件为Matlab2022a,CPU为R7−5800H,GPU为RTX3060,运行内存为16 GB。
利用全志H3芯片搭配128 GB的SD卡实时处理与存储音频数据,通过有线局域网传输,获取矿井提升电动机1 a的音频信号,并对其进行分析。采集装置和现场安装分别如图4和图5所示。
3.2 基于VMD和MFCC的特征提取
电动机音频信号采集过程中容易受到周围环境噪声的干扰,本文采用小波阈值降噪方法对音频信号进行去噪处理。采用db3小波、“qtwolog”阈值和4层小波分解的方法进行音频信号预处理,降噪效果如图6所示。可看出经过滤波后的信号振幅比原始信号的振幅有所减小,去除了很多由噪音产生的干扰,说明该方法能够保留原始信号的有效成分。当电动机正常工作时,发出的声音比较清脆,没有金属摩擦声;当电动机处于超载运行状态时,声音比较沉闷;当电动机电流处于非正常范围时,声音比正常情况大;当电动机轴承产生机械故障时,会发出刺耳的机械摩擦声且声音波形具有一定的周期性。
在WOA优化VMD算法时,设置模态总个数K的取值范围为(2,8),二次惩罚因子的取值范围为(1 000,4 000),种群规模为30,最大迭代次数为30。对一台电动机超载故障音频信号进行WOA−VMD分解,最小包络熵迭代曲线如图7所示。可看出最小包络熵在迭代第8次时达到最小值10.7339。此时,最小包络熵对应的鲸鱼位置为(2 976.6,7)。
为了提高准确性,分别对每种运行状态的10组优化参数取均值,得到最优参数,见表2。
表 2 最优VMD参数Table 2. Optimal VMD parameters数据类型 惩罚因子 模态个数 电流故障 2 064 5 正常状态 1 968 5 机械故障 2 532 6 超载故障 2 666 7 为了验证WOA−VMD方法的有效性,采用VMD,EMD和EEMD 3种方法分别对电动机机械故障音频信号进行分解,设置优化后的VMD参数,3种方法得到的IMF分量时域图和频域图如图8−图10所示。可看出EMD分解的IMF1出现模态混叠问题,而EEMD和VMD分解的每个IMF分量都具有独立的中心频率且分布均匀,在频域上表现出稀疏性的特点,能够有效避免模态混叠问题[21];在IMF求解中,VMD分解通过镜像延拓的方式避免了EMD和EEMD分解中出现的端点效应问题。
VMD,EMD和EEMD分解分别得到6、8、9个IMF分量,3种方法各分量相关系数见表3。可看出EMD分解的IMF5−IMF8与原始信号相关性弱,EEMD分解的IMF7−IMF9与原始信号相关性弱,2种方法都含有较多虚假分量,而VMD分解的IMF分量与原始信号相关程度大,且没有出现无趋势分量。因此,VMD分解能更加充分反映原始信号的静态和动态特征,从而提高故障诊断准确率。
表 3 不同分解方式的相关系数Table 3. Correlation coefficients of different decomposition modes分解方式 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 IMF9 VMD 0.349 0 0.335 1 0.405 8 0.825 1 0.249 2 0.166 0 − − − EMD 0.262 6 0.794 7 0.318 4 0.259 1 0.088 7 0.0387 −0.018 0 0.009 2 − EEMD 0.195 4 0.686 4 0.421 3 0.201 1 0.194 2 0.214 0 0.054 2 0.032 2 0.022 5 由于电动机不同运行状态的音频信号分解后得到的IMF分量个数不同,且大多数重要信息集中在低频模态中,VMD将音频信号按低频到高频分解为K个模态分量,为了方便构建相同大小的特征模块,采用Pearson相关系数对IMF分量进行筛选,各IMF分量相关系数如图11所示。可看出IMF1−IMF4包含较多有效信息,故对IMF1−IMF4进行MFCC特征提取。
3.3 模型性能对比
为了验证本文提出的CNN−BiLSTM模型的诊断效果,将其与CNN,BiLSTM和CNN−LSTM模型进行对比。各模型训练的损失函数曲线如图12所示。可看出CNN−BiLSTM模型收敛速度最快,且损失函数值较稳定,而CNN模型收敛速度较慢,CNN−LSTM和BiLSTM模型损失函数值波动较大,说明CNN−BiLSTM模型仅需较少的迭代次数便可得到相对精确的值。
对提取的音频信号特征按训练样本和测试样本7∶3的比例进行实验。设置电动机正常状态、电流故障、机械故障和超载故障标签分别为1、2、3、4。不同模型的测试集诊断效果如图13所示。可看出CNN故障诊断出错最多,BiLSTM和CNN−LSTM模型故障诊断出错比CNN要少,但准确率均不超过95%,CNN−BiLSTM模型出错最少,准确率最高,达98.611 1%。
以故障诊断准确率和训练时间对4种故障诊断模型进行评价,结果见表4。可看出CNN模型的诊断准确率最低,训练时间最短,BiLSTM和CNN−LSTM 模型的诊断效果相近且都优于CNN模型,但BiLSTM的训练时间相对较短,CNN−BiLSTM模型的故障诊断准确率最高,达98.61%,诊断效果最好,但训练时间也相对增加,这是因为BiLSTM进行双向时间序列特征提取,网络模型复杂度增加,训练效率也会有所降低,但符合实时性要求。
表 4 不同模型评价结果Table 4. Evaluation results of different models模型类型 准确率/% 训练时间/s CNN 92.78 9 BiLSTM 94.44 10 CNN−LSTM 94.72 12 CNN−BiLSTM 98.61 14 将提取的13维音频信号MFCC特征与39维音频信号MFCC特特征进行对比,诊断结果如图14所示。可看出仅提取13维MFCC特征的故障诊断准确率为97.5%,2种特征提取方法下故障诊断的平均准确率均达到95%以上,而39维度信号特征更加充分提取了音频信号的静态特征和动态特征,平均准确率提高了1.11%。
4. 结论
1) 提出了基于WOA−VMD的电动机音频信号特征提取方法,采用WOA对VMD模态个数和惩罚因子进行寻优,对电动机不同运行状态音频信号进行分解,与EMD和EEMD分解方法相比,WOA−VMD不会出现模态混叠问题且无虚假分量,有利于提取原始信号的故障信息。
2) 通过提取各主模态分量的39维MFCC构成特征向量,输入到CNN−BiLSTM进行故障诊断。与仅提取13维MFCC静态特征进行对比实验,基于VMD和CNN−BiLSTM的电动机故障诊断方法的精确度更高,说明39维MFCC可更加充分地表征电动机原始音频信号故障特征。
3) 采用基于CNN−BiLSTM的电动机故障诊断方法对输入的MFCC特征向量进行故障识别,通过对比实验可知,CNN、BiLSTM、CNN−LSTM和CNN−BiLSTM 4种诊断模型的准确率分别为92.78%,94.44%,94.72和98.61%。
-
表 1 各网络层参数
Table 1 Parameters of each network layer
网络层 主要参数 卷积层1 核大小:$ 5 \times 1 $,数量:32,步长:1 池化层1 核大小:$ 2 \times 1 $,步长:1 卷积层2 核大小:$ 3 \times 1 $,数量:64,步长:1 池化层2 核大小:$ 2 \times 1 $,步长:1 BiLSTM层 单元数:5 全连接层 — Softmax层 — 表 2 最优VMD参数
Table 2 Optimal VMD parameters
数据类型 惩罚因子 模态个数 电流故障 2 064 5 正常状态 1 968 5 机械故障 2 532 6 超载故障 2 666 7 表 3 不同分解方式的相关系数
Table 3 Correlation coefficients of different decomposition modes
分解方式 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 IMF9 VMD 0.349 0 0.335 1 0.405 8 0.825 1 0.249 2 0.166 0 − − − EMD 0.262 6 0.794 7 0.318 4 0.259 1 0.088 7 0.0387 −0.018 0 0.009 2 − EEMD 0.195 4 0.686 4 0.421 3 0.201 1 0.194 2 0.214 0 0.054 2 0.032 2 0.022 5 表 4 不同模型评价结果
Table 4 Evaluation results of different models
模型类型 准确率/% 训练时间/s CNN 92.78 9 BiLSTM 94.44 10 CNN−LSTM 94.72 12 CNN−BiLSTM 98.61 14 -
[1] 何俊峰,肖慧明. 矿井提升机健康管理系统研究[J]. 制造业自化化,2020,42(6):4-7,38. HE Junfeng,XIAO Huiming. Reaserch on system of maganement for mine hoist[J]. Manufacturing Automation,2020,42(6):4-7,38.
[2] 赵书涛,王二旭,陈秀新,等. 声振信号联合1D−CNN的大型电机故障诊断方法[J]. 哈尔滨工业大学学报,2020,52(9):116-122. ZHAO Shutao,WANG Erxu,CHEN Xiuxin,et al. Fault diagnosis method for large motor based on sound-vibration signal combined with 1D-CNN[J]. Journal of Harbin Institute of Technology,2020,52(9):116-122.
[3] 李伟,李硕. 理解数字声音——基于一般音频/环境声的计算机听觉综述[J]. 复旦学报(自然科学版),2019,58(3):269-313. LI Wei,LI Shuo. Understanding digital audio−a review of general audio/ambient sound based computer audition[J]. Journal of Fudan University(Natural Science),2019,58(3):269-313.
[4] 李海. 基于EMD和特征融合的电机故障诊断[D]. 杭州: 浙江大学, 2013. LI Hai. Faults diagnosis of motor based on EMD and feature-fusion[D]. Hangzhou: Zhejiang University, 2013.
[5] 孙杰臣. 基于音频的矿井提升机故障诊断和健康预测系统[D]. 淮南: 安徽理工大学, 2021. SUN Jiechen. Fault diagnosis and health prediction system for mine hoists based on audio signal[D]. Huainan: Anhui University of Science and Technology, 2021.
[6] 路敬祎,马雯萍,叶东,等. 基于VMD的音频信号增强算法研究[J]. 机械工程学报,2018,54(10):10-15. DOI: 10.3901/JME.2018.10.010 LU Jingyi,MA Wenping,YE Dong,et al. Algorithm of sound signal enhancement based on VMD[J]. Journal of Mechanical Engineering,2018,54(10):10-15. DOI: 10.3901/JME.2018.10.010
[7] 丁石川,厉雪衣,杭俊,等. 深度学习理论及其在电机故障诊断中的研究现状与展望[J]. 电力系统保护与控制,2020,48(8):172-187. DING Shichuan,LI Xueyi,HANG Jun,et al. Deep learning theory and its application to fault diagnosis of an electric machine[J]. Power System Protection and Control,2020,48(8):172-187.
[8] 马立玲,刘潇然,沈伟,等. 基于一种改进的一维卷积神经网络电机故障诊断方法[J]. 北京理工大学学报,2020,40(10):1088-1093. MA Liling,LIU Xiaoran,SHEN Wei,et al. Motor fault diagnosis method based on an improved one-dimensional convolutional neural network[J]. Transactions of Beijing Institute of Technology,2020,40(10):1088-1093.
[9] 张鹏,束小曼,厉雪衣,等. 基于LSTM的交流电机系统故障诊断方法研究[J]. 电机与控制学报,2022,26(3):109-116. ZHANG Peng,SHU Xiaoman,LI Xueyi,et al. LSTM-based fault diagnosis of AC electric machine system[J]. Electric Machines and Control,2022,26(3):109-116.
[10] 向玲,王朋鹤,李京蓄. 基于CNN−LSTM的风电机组异常状态检测[J]. 振动与冲击,2021,40(22):11-17. XIANG Ling,WANG Penghe,LI Jingxu. Abnormal state detection of wind turbines based on CNN-LSTM[J]. Journal of Vibration and Shock,2021,40(22):11-17.
[11] 李可,牛园园,宿磊,等. 参数优化VMD的滚动轴承故障诊断方法[J]. 振动工程学报,2023,36(1):280-287. LI Ke,NIU Yuanyuan,SU Lei,et al. Rolling bearing fault diagnosis method based on parameter optimized VMD[J]. Journal of Vibration Engineering,2023,36(1):280-287.
[12] ZOSSO D,DRAGOMIRETSKIY K. Variational mode decomposition[J]. IEEE Transactions on Signal Processing:A Publication of the IEEE Signal Procession Society,2014,62(3):531-544.
[13] MIRJALILI S,LEWIS A. The whale optimization algorithm[J]. Advances in Engineering Software,2016,95:51-67. DOI: 10.1016/j.advengsoft.2016.01.008
[14] 曹仕骏,郑近德,潘海洋,等. 基于改进自适应经验傅里叶分解的滚动轴承故障诊断方法[J]. 振动与冲击,2022,41(15):287-299. CAO Shijun,ZHENG Jinde,PAN Haiyang,et al. Enhanced adaptive empirical Fourier decomposition based rolling bearing fault diagnosis method[J]. Journal of Vibration and Shock,2022,41(15):287-299.
[15] 王前,王刚,蒋晗晗,等. 基于MFCC与CDET的滚动轴承故障诊断方法研究[J]. 控制工程,2019,26(9):1682-1686. WANG Qian,WANG Gang,JIANG Hanhan et al. Study on fault diagnosis of rolling bearing based on MFCC and CDET[J]. Control Engineering of China,2019,26(9):1682-1686.
[16] 李宏全,郭兴明,郑伊能. 基于EMD和MFCC的舒张期心杂音的分类识别[J]. 振动与冲击,2017,36(11):8-13. LI Hongquan,GUO Xingming,ZHENG Yineng. Classification and recognition of diastolic heart murmurs based on EMD and MFCC[J]. Journal of Vibration and Shock,2017,36(11):8-13.
[17] 刘思思,谭建平,易子馗. 基于MFCC和SVM的车窗电机异常噪声辨识方法研究[J]. 振动与冲击,2017,36(5):102-107. LIU Sisi,TAN Jianping,YI Zikui. A window motor abnormal noiseidentification method based on MFCC and SVM[J]. Journal of Vibration and Shock,2017,36(5):102-107.
[18] 崔佳嘉,马宏忠. 基于改进MFCC和3D-CNN的变压器铁心松动故障声纹识别模型[J]. 电机与控制学报,2022,26(12):150-160. CUI Jiajia,MA Hongzhong. Voiceprint recognition model of transformer core looseness fault based on improved MFCC and 3D-CNN[J]. Electric Machines and Control,2022,26(12):150-160.
[19] 汪欣,毛东兴,李晓东. 基于声信号和一维卷积神经网络的电机故障诊断研究[J]. 噪声与振动控制,2021,41(2):125-129. WANG Xin,MAO Dongxing,LI Xiaodong. Motor fault diagnosis using microphones and one-dimensional convolutional neural network[J]. Noise and Vibration Control,2021,41(2):125-129.
[20] 董绍江,李洋,梁天,等. 基于CNN−BiLSTM的滚动轴承变工况故障诊断方法[J]. 振动. 测试与诊断,2022,42(5):1009-1016,1040. DONG Shaojiang,LI Yang,LIANG Tian,et al. Fault diagnosis method of rolling bearing based on CNN-BiLSTM under variable working conditions[J]. Journal of Vibration,Measurement & Diagnosis,2022,42(5):1009-1016,1040.
[21] 王宏伟,孙文磊,张小栋,等. 基于优化VMD复合多尺度散布熵及LSTM的风力发电机齿轮箱故障诊断方法研究[J]. 太阳能学报,2022,43(4):288-295. WANG Hongwei,SUN Wenlei,ZHANG Xiaodong,et al. Fault diagnosis method of wind turbine's gearbox based on composite multiscale dispersion entropy of optimised WMD and LSTM[J]. Acta Energiae Solaris Sinica,2022,43(4):288-295.