改进遗传算法优化的矿井局部通风机模糊PID控制器设计

胡业林, 邓想, 郑晓亮

胡业林,邓想,郑晓亮.改进遗传算法优化的矿井局部通风机模糊PID控制器设计[J].工矿自动化,2021,47(9):38-44.. DOI: 10.13272/j.issn.1671-251x.2021030086
引用本文: 胡业林,邓想,郑晓亮.改进遗传算法优化的矿井局部通风机模糊PID控制器设计[J].工矿自动化,2021,47(9):38-44.. DOI: 10.13272/j.issn.1671-251x.2021030086
HU Yelin, DENG Xiang, ZHENG Xiaoliang. Design of fuzzy PID controller for mine local ventilator optimized by improved genetic algorithm[J]. Journal of Mine Automation, 2021, 47(9): 38-44.. DOI: 10.13272/j.issn.1671-251x.2021030086
Citation: HU Yelin, DENG Xiang, ZHENG Xiaoliang. Design of fuzzy PID controller for mine local ventilator optimized by improved genetic algorithm[J]. Journal of Mine Automation, 2021, 47(9): 38-44.. DOI: 10.13272/j.issn.1671-251x.2021030086

改进遗传算法优化的矿井局部通风机模糊PID控制器设计

基金项目: 

“十三五”国家重点研发计划项目(2018YFC0808000)

详细信息
  • 中图分类号: TD635

Design of fuzzy PID controller for mine local ventilator optimized by improved genetic algorithm

  • 摘要: 目前局部通风机控制主要采用传统PID控制器,控制器的参数固定且多依据经验选取,很难实现隶属度函数和模糊规则的最优组合,使得控制器难以满足局部通风机自适应的控制要求。针对该问题,设计了一种改进遗传算法优化的矿井局部通风机模糊PID控制器。在改进遗传算法中引入欧氏距离提高种群的多样性,同时引入自适应交叉和变异概率来提高算法的收敛性。在编码过程中采用比例分数间接实现对隶属度函数的优化,使得改进遗传算法能够同时优化隶属度函数和模糊规则。将优化得到的隶属度函数和模糊规则导入模糊PID控制器中,控制器能够根据局部通风机的不同工作状态,通过变频器自适应调整局部通风机的风量,实现对局部通风机的动态调节。仿真结果表明,相较于传统模糊PID控制器,改进模糊PID控制器可基本实现无超调,且上升时间缩短了56.25%,稳定时间缩短了47.06%,能够更好地满足矿井局部通风机的控制要求。
    Abstract: At present, the local ventilator control mainly uses traditional PID controllers. The parameters of the controller are fixed and selected based on experience. It is difficult to achieve the optimal combination of membership functions and fuzzy rules, which makes it difficult for the controller to meet the adaptive control requirements of local ventilator. In order to solve this problem, a fuzzy PID controller for mine local ventilator optimized by improved genetic algorithm is designed. In the improved genetic algorithm, the Euclidean distance is introduced to increase the diversity of the population, and the adaptive crossover and mutation probability are introduced to improve the convergence of the algorithm. In the encoding process, the proportional fraction is used to indirectly optimize the membership functions, which enables the improved genetic algorithm to optimize both the membership functions and fuzzy rules. The optimized membership functions and fuzzy rules are imported into the fuzzy PID controller. The controller can adaptively adjust the air volume of the local ventilator through the inverter according to the different working status of the local ventilator so as to realize the dynamic adjustment of the local ventilator. The simulation results show that compared with the traditional fuzzy PID controller, the improved fuzzy PID controller can basically achieve no overshoot, the rise time is shortened by 56.25%, and the stabilization time is shortened by 47.06%, which can better meet the control requirements of mine local ventilator.
  • 滚动轴承作为煤矿机械设备中的重要部件之一[1],其工作环境复杂,易出现损坏,从而影响煤矿生产系统的可靠性和安全性。因此,对煤矿机械设备中的滚动轴承进行智能故障诊断具有重要意义[2]

    随着机器学习的快速发展,深度学习被引入到机械设备智能故障诊断中,并取得了一定的成果。但基于深度学习的机械设备故障诊断模型却要求训练集和测试集满足独立同分布的原则,当训练集与测试集分布不同时,会出现模型泛化能力差的问题[3]。由于工业过程中大量数据样本难以被标记,且滚动轴承又常常工作在变工况情况下,导致实际故障诊断中缺少或无法获取与待测数据分布相同的大量带标签训练数据[4]

    鉴此,研究者们将迁移学习(Transfer Learning,TL)引入到故障诊断中,以实现不同工况之间的知识迁移。文献[5]使用少量的目标域标记数据对源域数据训练好的模型进行微调,以此获得目标域数据的故障诊断模型。文献[6]提出了一种基于参数迁移的改进最小二乘支持向量机迁移学习方法,实现了目标域中已知标签数据较少条件下的滚动轴承故障诊断。文献[7]通过改进TrAdaBoost方法对源域样本重新加权,提升了分类准确率。

    但上述方法均需目标域含少量带标签样本,当目标域完全不含标签时,模型泛化能力变弱且诊断准确率下降。无监督的域适应方法可通过学习源域和目标域的共享特征来减小域之间的差异,进而解决目标域数据不含标签的问题[8]。文献[9]设计了一种跨设备故障诊断模型,该模型主要引入最大均值差异(Maximum Mean Discrepancies, MMD)公式来度量源域和目标域的特征分布差异,进而帮助一维卷积神经网络(Convolutional Neural Networks,CNN)学习源域和目标域的共享特征,达到无监督迁移学习的目的。文献[10]在MMD公式的基础上,提出多核最大均值差异(Multi Kernel−Maximum Mean Discrepancies, MK−MMD)距离,将带标签源域样本和无标签目标域样本的特征同时映射到希尔伯特空间进行度量,产生域间分布差异损失,进而使模型选择更多源域与目标域相似特征。文献[11]提出一种基于域对抗学习策略的故障诊断网络,该网络学习通用的域不变特征,以提高模型的泛化能力。文献[12]在域分类器中添加Wasserstein距离,通过域对抗训练,实现了对无标签目标域样本的分类。但目前研究大部分集中于源域与目标域的边缘分布对齐,缺乏对数据间条件分布的研究,导致一些目标域样本被错误分类。

    为避免一些目标域样本被错误分类,本文提出一种基于深度自适应迁移学习网络(Deep Adaptive Transfer Learning Network,DATLN)的诊断模型,并将其应用到滚动轴承的故障诊断中。首先,结合多尺度卷积神经网络(Multiscale Convolutional Neural Network, MSCNN)和双向长短时记忆网络(Bi−directional Long Short−Term Memory,BiLSTM)提取振动信号中多尺度和蕴含时间信息的故障特征;其次,构建域自适应模块,引入域对抗(Domain Adversarial,DA)训练,结合自适应联合分布(Adaptive Joint Distribution,AJD)度量机制,动态地减少源域和目标域数据的边缘分布和条件分布差异;最后,使用带标签的源域样本和无标签的目标域样本训练网络,进而实现对无标签目标域样本进行分类。

    假设在机械装备中存在工况A和工况B 2个工况,工况A为有标签的源域:${D}_{s}={\left\{{x}_{i}, {y}_{i}\right\}}_{i=1}^{s}, i= $$ 1,2,\cdots , s$s为源域的样本个数,工况B为无标签的目标域:$ {D_t} = \left\{ {{x_j}} \right\}_{j = 1}^t,j = 1,2, \cdots ,t $t为目标域的样本个数,其中,xixj分别为第i个源域样本和第j个目标域样本,yi为第i个源域样本的标签,源域和目标域的特征空间及类别空间均相同。但由于数据产生机制的影响,源域Ds和目标域Dt的边缘分布和条件分布均不同。因此,无监督迁移学习的目标就是利用带标签源域Ds的先验知识建立一个模型,以实现无标签目标域Dt的样本分类,如图1所示。

    图  1  迁移学习
    Figure  1.  Transfer learning

    CNN结构主要包含卷积层、池化层和全连接层[13]。卷积层通过卷积核对输入信号进行卷积操作,并进行故障特征提取,池化层对卷积层提取的数据进行降维,全连接层负责将卷积层和池化层处理后的数据进一步拟合。

    卷积层中同一层卷积核的权值相同,即

    $$ c_a^l = f\left( {\sum\limits_{d = 1}^m {c_d^{l - 1}*{\boldsymbol{w}}_a^l + {\boldsymbol{b}}_a^l} } \right)$$ (1)

    式中:$ c_a^l $l层输出的第a个特征量;f为激活函数;$c_d^{l - 1}$$ l - 1 $层输出的第d个特征量,$d=1,2,\cdots,m $m为层的特征量总个数;*为卷积运算;$ {\boldsymbol{w}}_a^l $l层输出的第a个卷积核权重矩阵;$ {\boldsymbol{b}}_a^l $l层输出的第a个卷积核偏置矩阵。

    池化层采用最大值池化函数,获得池化区域的最大值:

    $$ p_{\max }^{l(o,g)} = \mathop {\max }\limits_{(g - 1)h \leqslant e{\kern 1pt} \leqslant gh} \left\{ {{u^{l(o,e)}}} \right\} $$ (2)

    式中:h为卷积核宽度;ul(o,e)为第l层中第o个特征张量的第e个神经元,$l=1,2,\cdots,g $g为层的总数,o = 1,2, …, qq为特征张量总个数。

    全连接层中采用Softmax函数将全连接层获取的特征数据映射到(0,1),并将映射结果输出,实现故障分类。

    $$ {r_n} = {{\exp \left( {{\phi _n}} \right)} \mathord{\left/ {\vphantom {{\exp \left( {{\phi _n}} \right)} {\sum\limits_{n = 1}^C {\exp \left( {{\phi _n}} \right)} }}} \right. } {\sum\limits_{n = 1}^C {\exp \left( {{\phi _n}} \right)} }} $$ (3)

    式中:rn为输出结果为第n类的概率;${\phi_n} $为全连接层第n类的输出值;C为数据集类别个数。

    故障信息属于时序信号,而BiLSTM网络适用于提取时序信号的时间关联性。关注故障信息的时间关联性可进一步有效提高深度网络的特征挖掘能力。BiLSTM网络由前向LSTM层和反向LSTM层组成,如图2所示,其中Wu为输入神经元数据,ku为输出神经元结果,u为神经元个数。因此,可在前向和后向2个方向上学习故障特征的时间信息,且2个方向均具有独立的隐藏层。

    图  2  BiLSTM网络结构
    Figure  2.  Structure of BiLSTM network

    当滚动轴承损伤时,受振动耦合影响,故障特征呈现多尺度性[14]。由于MSCNN网络能自适应提取信号中的多尺度特征,从而可获得一些重要的故障特征信息[15];而BiLSTM网络能从前后2个方向学习振动信号的时间信息,使特征信息更加全面。本文结合MSCNN网络和BiLSTM网络的优势构建MSCNN−BiLSTM网络,网络结构如图3所示。

    图  3  MSCNN−BiLSTM网络
    Figure  3.  MSCNN-BilSTM network

    图3可看出,MSCNN网络由通道1、通道2和汇聚层组成,MSCNN网络通道1选用较大卷积核,以给予卷积网络足够大的感受野,进而捕获振动信号的低频特征;MSCNN网络通道2采用较小卷积核,以保持卷积网络提取局部特征的优势;汇聚层对通道1和通道2的输出结果进行特征融合,且只做张量乘积运算,因此没有设定超参数。对MSCNN−BiLSTM网络参数进行反复实验和调整,结果见表1。MSCNN网络采用一维卷积运算,通道1和通道2中的卷积核尺寸分别为15和5。为将每层卷积输出值大小保持在一定范围内,对每个卷积层输出的结果进行批量归一化处理。此外,分别在卷积层2和卷积层6后面接入最大池化层,采用最大池化操作降低数据维度,并将最大池化层的核(池化窗口)尺寸和步长设置为2;为保证每个通道输出尺寸为(128,4),分别在卷积层4和卷积层8后面引入自适应最大池化层。BiLSTM网络包含1层结构,神经元个数为256。

    表  1  MSCNN−BiLSTM网络参数
    Table  1.  Parameters of MSCNN-BiLSTM network
    网络层类型核尺寸/步长核数量激活
    函数
    输入尺寸输出尺寸
    MSCNN网络通道1卷积层115/116ReLU(1,1 024)(16,1 010)
    卷积层215/132ReLU(16,1 010)(32,996)
    最大池化层2/2(32,996)(32,498)
    卷积层315/164ReLU(32,498)(64,484)
    卷积层415/1128ReLU(64,484)(128,470)
    自适应最大
    池化层
    (128,470)(128,4)
    MSCNN网络通道2卷积层55/116ReLU(1,1 024)(16,1 020)
    卷积层65/132ReLU(16,1 020)(32,1 016)
    最大池化层2/2(32,1 016)(32,508)
    卷积层75/164ReLU(32,508)(64,504)
    卷积层85/1128ReLU(64,504)(128,500)
    自适应最大
    池化层
    (128,500)(128,4)
    MSCNN网络
    汇聚层
    汇聚层(128,4),(128,4)(128,4)
    BiLSTM网络BiLSTM层ReLU(128,4)(256)
    下载: 导出CSV 
    | 显示表格

    基于DATLN的滚动轴承故障诊断模型如图4所示,DATLN由状态识别和域自适应2个模块组成。状态识别模块包括MSCNN−BiLSTM特征提取网络、瓶颈层和标签分类器,其中瓶颈层和标签分类器中均采用一层全连接网络,瓶颈层神经元个数为256,标签分类器的神经元个数为样本标签类别数。域自适应模块由域分类器和AJD度量组成,其中域分类器采用3层全连接网络,前2层引入Relu激活函数,最后1层采用Sigmoid函数对样本进行域分类。域分类器参数见表2

    图  4  滚动轴承故障诊断模型
    Figure  4.  Model of rolling bearing fault diagnosis
    表  2  域分类器参数
    Table  2.  Parameters of domain classifier
    层次神经元个数
    全连接层1256
    全连接层2128
    全连接层32
    下载: 导出CSV 
    | 显示表格

    DATLN模型诊断流程如下:

    (1) 通过不重叠采样对源域和目标域的故障数据进行分割,获取固定长度的样本,利用归一化技术使样本值保持在一定范围内,完成对原始振动信号的预处理。

    (2) 在状态识别模块中,利用源域样本进行有标签监督训练,通过标签分类器识别滚动轴承的状态;在域自适应模块中,域分类器结合AJD度量,动态减小源域与目标域的边缘分布和条件分布差异,进而实现源域与目标域样本自适应匹配的目的。

    DATLN诊断模型的损失函数L包含标签分类损失LP、域分类损失LD及自适应联合分布损失LJ 3个部分。

    $$ L\left( {{\theta _{\text{G}}},{\theta _{\text{B}}},{\theta _{\text{P}}},{\theta _{\text{D}}}} \right) = {L_{\text{P}}} + {L_{\text{J}}} + {L_{\text{D}}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} $$ (4)

    式中:θG为特征提取网络参数;θB为瓶颈层参数;θP为标签分类器参数;θD为域分类器参数。

    标签分类器通过有监督方式对状态识别模块进行训练,识别源域样本的故障类别。采用交叉熵损失函数衡量标签分类损失。

    $$ {L_{\text{P}}} = - \frac{1}{s}\sum\limits_{{x_i} \in {D_s}} {\sum\limits_{x_i}^E {{T_{{x_{i \to E}}}}\lg {G_{\text{P}}}} } \left( {{G_{\text{B}}}\left( {{G_{\text{G}}}\left( {{x_i}} \right)} \right)} \right) $$ (5)

    式中:E为源域样本xi所属类别;T为每类样本的概率;GP为标签分类器;GB为瓶颈层;GG为特征提取网络。

    域分类器用于区分样本的所属域,通过最大化域分类损失来约束MSCNN−BiLSTM网络,进而提取更多与目标域相似的特征。设源域样本的域标签为0,目标域样本的域标签为1,此时,域分类属二分类,因此域分类损失采用二元交叉熵损失函数衡量。

    $$ {L_{\text{D}}} = - \lambda \left[ {\frac{1}{{s + t}}\sum\limits_{{x_i} \in {D_s} \cup {D_t}} {{L_{\rm{B}}}\left( {{G_{\text{D}}}\left( {{G_{\text{G}}}\left( {{x_i}} \right)} \right),{D_i}} \right)} } \right] $$ (6)
    $$ \lambda =\dfrac{1-{\text{ exp}}\left( { - 10\beta } \right)} {1 + {\text{exp}}\left( { - 10\beta } \right)} $$ (7)

    式中:$\lambda $为权衡参数;LB为二元交叉熵损失函数;GD是域分类器;Di为输入样本的域标签;β为当前迭代次数与总迭代次数的比。

    迁移成分分析(Transfer Component Analysis,TCA)[16]主要用于减小源域、目标域之间的边缘分布差异。TCA通常只关注全局分布对齐,而忽略了源域和目标域同一类别子域间的条件分布差异,从而导致迁移效果不理想。为此,本文采用联合域适配(Joint Domain Adaptation,JDA)算法[17],引入自适应联合分布(Adaptive Joint Distribution,AJD)损失,通过衡量域间联合分布距离,以减小源域和目标域的边缘分布与条件分布差异。由于目标域没有样本标签,使用标签分类器预测结果作为伪标签,参与条件分布差异计算过程。假设进行源域、目标域特征对齐时边缘分布(P)和条件分布(Q)的权值相同,可将域间联合分布距离定义为

    $$ {f'}\left( {{D_{{s}}},{D_{{t}}}} \right) \approx {f'}\left( {{P_{{s}}},{P_{{t}}}} \right) + {f'}\left( {{Q_{{s}}},{Q_{{t}}}} \right) $$ (8)

    式中:${f'} $为映射函数;PsPt分别为源域、目标域的边缘分布; QsQt分别为源域、目标域的条件分布。

    在现实情况中边缘分布和条件分布的重要性是随着迭代训练动态变化的,所以只有动态地计算边缘分布和条件分布在迁移过程中的各自占比,才能有效地提升迁移诊断精度。引入衡量因子α,诊断模型每次迭代训练完成后,重新评估边缘分布和条件分布的重要性。

    $$ {L_{\rm{J}}} = (1 - \alpha ){f'}({P_s},{P_t}) + \alpha {f'}({Q_s},{Q_t}) $$ (9)
    $$ \alpha = \frac{{{f'}({Q_s},{Q_t})}}{{{f'}({P_s},{P_t}) + {f'}({Q_s},{Q_t})}} $$ (10)

    边缘分布与条件分布均采用MMD公式计算,即

    $$ {v}\left( {{x_s},{x_t}} \right) = {\left\| {\frac{1}{s}\sum\limits_{i = 1}^s {\varphi \left( {{x_i}} \right) - \frac{1}{t}\sum\limits_{j = 1}^t {\varphi \left( {{x_j}} \right)} } } \right\|_H} $$ (11)

    式中:v为源域与目标域分布的距离;$\varphi $为高斯核函数;H为希尔伯特空间。

    为验证MSCNN−BiLSTM网络抗噪性能及域自适应模块的迁移能力,进行抗噪实验和迁移实验。在无域自适应模块下,对MSCNN−BiLSTM网络进行抗噪性能测试,并在凯斯西储大学(CWRU)轴承数据集上与LeNet−5,MSCNN和BiLSTM进行对比实验。在Spectra Quest机械故障实验台的实测数据集上,采用Baseline,TCA和域对抗神经网络(Domain Adversarial Neural Network,DANN)[11]3种方法与本文DA+AJD域自适应方法进行对比,其中Baseline方法只采用状态识别模块,即运用源域训练好的模型对无标签目标域样本直接进行诊断。

    采用CWRU轴承数据集在4种不同强度的噪声环境中做抗噪实验。实验装置如图5所示。测试台主要由1.5 kW电动机、功率测试计和控制设备等组成。实验轴承型号为SKF6205,在0,0.75,1.5,2.25 kW 4种不同负载下采集实验轴承数据,采样频率为12 kHz。每种负载下均包含正常状态及内圈、外圈、滚动体3种故障损伤状态,损伤直径分别为 0.177 8,0.355 6 ,0.533 4 mm,共计10种状态。为方便表述,以0负载下采集的数据集为例,见表3

    图  5  CWRU轴承数据采集系统
    Figure  5.  CWRU bearing data acquisition system
    表  3  0负载下数据集
    Table  3.  Date set under 0 load
    损伤直径/mm损伤位置标记
    正常N
    0.177 8内圈IR07
    0.355 6内圈IR14
    0.533 4内圈IR21
    0.177 8外圈OR07
    0.355 6外圈OR14
    0.533 4外圈OR21
    0.177 8滚动体B07
    0.355 6滚动体B14
    0.533 4滚动体B21
    下载: 导出CSV 
    | 显示表格

    为避免样本之间有重叠区域,通过不重叠采样对原始信号进行分割,如图6所示。每个样本包含1 024个点,产生的样本数量见表4

    图  6  不重叠采样
    Figure  6.  Non-overlapping sampling
    表  4  CWRU样本集
    Table  4.  CWRU sample set
    状态标签样本数
    00.75 kW1.5 kW2.25 kW
    N 0 100 100 100 100
    IR07 1 100 100 100 100
    B07 2 100 100 100 100
    OR07 3 100 100 100 100
    IR14 4 100 100 100 100
    B14 5 100 100 100 100
    OR14 6 100 100 100 100
    IR21 7 100 100 100 100
    B21 8 100 100 100 100
    OR21 9 100 100 100 100
    下载: 导出CSV 
    | 显示表格

    采样完成后,通过归一化公式将每个样本的数据映射到同一尺度。

    $$ {z_{\text{η}} } = \frac{{{z_{\text{φ}} } - \mu }}{\sigma } $$ (12)

    式中:$ {z_{\text{η }}} $为归一化后的样本数据;${z_{\text{φ}} }$为输入的样本数据;$ \mu $为样本数据的平均值;$ \sigma $为样本数据的标准差。

    在实际工程环境中,传感器接收的信号通常无法避免噪声干扰,故在原始故障数据中添加不同信噪比(Signalto Noise Ratio,SNR)的高斯白噪声,以测试MSCNN−BiLSTM网络在噪声环境下的抗噪性能,信噪比公式为

    $$ N = 10{\rm{lg}} ({{{X_{\rm{S}}}} \mathord{\left/ {\vphantom {{{X_{\rm{S}}}} {{X_{\rm{n}}}}}} \right. } {{X_{\rm{n}}}}}) $$ (13)

    式中:XS为原始信号;Xn为噪声信号。

    加入不同强度噪声后,为直接观察振动信号的变化,从滚动轴承的10 种状态里随机选取正常状态与内圈故障(IR07)状态进行展示,如图7图8所示。与原始信号相比,添加噪声后,其周期性冲击分量明显减弱,噪声强度随着信噪比的降低而增强,深度网络对轴承故障的辨识将更加困难。在加入不同强度噪声后,其他状态下振动信号的变化趋势与正常状态和内圈故障(IR07)状态下的变化趋势一致。

    图  7  正常状态下振动信号变化
    Figure  7.  Vibration signal changes under the normal state
    图  8  内圈故障(IR07)状态下振动信号变化
    Figure  8.  Vibration signal changes in the inner fault (IR07) state

    为验证MSCNN−BiLSTM网络的优势,将其分别与LeNet−5,MSCNN和BiLSTM进行比较。实验使用Radam优化器,学习率为0.01,迭代次数为100,批量为64,训练集与测试集比例是4∶1。为测试本文特征提取网络在单负载场景下对轴承故障特征的提取能力,分别在4种不同负载下实验。为消除偶然误差,采用5次实验结果的平均值评估网络性能,如图9图12所示。

    图  9  无噪声环境下对比实验结果
    Figure  9.  Comparison of experimental results in noiseless environment
    图  12  3 dB噪声环境下对比实验结果
    Figure  12.  Comparison of experimental results in 3 dB environment
    图  11  5 dB噪声环境下对比实验结果
    Figure  11.  Comparison of experimental results in 5 dB environment

    图9可看出,在无噪声环境下,MSCNN−BiLSTM网络的识别准确率均达到99%以上,在4种网络中准确率最高,可见其具有较好的特征提取能力。从图10图12可看出,4种网络的识别准确率随着噪声强度的增强而降低。为综合比较每种网络的性能,在3,5,10 dB噪声下,计算每种网络在4种负载下识别准确率的平均值,结果见表5

    表  5  不同网络的平均识别准确率
    Table  5.  Average accuracy of different network
    网络平均识别准确率/%
    3 dB5 dB10 dB
    LeNet−590.7493.8395.42
    MSCNN95.5796.8997.14
    BiLSTM89.1092.5896.99
    MSCNN−BiLSTM98.4399.0099.16
    下载: 导出CSV 
    | 显示表格
    图  10  10 dB噪声环境下对比实验结果
    Figure  10.  Comparison of experimental results in 10 dB environment

    表5可知,在3,5,10 dB噪声环境下,MSCNN−BiLSTM网络的平均识别准确率分别为98.43%,99.00%和99.16%,比LeNet−5,MSCNN和BiLSTM的平均识别准确率均高,实验结果证明了MSCNN−BiLSTM网络具有较好的抗噪声干扰性能。

    为了观察迭代过程中网络的故障诊断性能变化,随机选取0负载下的数据集,在无噪声和3 dB噪声2种环境下进行迭代,测试集识别结果分别如图13图14所示。可看出MSCNN−BiLSTM网络在无噪声环境和3 dB噪声环境下,均最先达到收敛且波动较小。

    图  13  无噪声环境下0负载测试集识别结果
    Figure  13.  Identification results of 0 load test set in noise-free environment
    图  14  3 dB噪声环境下0负载测试集识别结果
    Figure  14.  Identification results of 0 load test set in 3 dB environment

    为验证域自适应模块的迁移能力,采用机械故障模拟台收集轴承故障数据,并进行对比实验。实验台主要由电动机转速控制器、旋转轴和传感器等组成,其结构如图15所示。实验轴承的型号为ER12KCL,在轴承转速为1 400,1 800,2 200 r/min下收集实验数据。轴承的状态包括正常、内圈故障、外圈故障和滚动体故障4种。所有实验轴承的直径均为19.05 mm。通过电动机驱动端轴承座上的加速度传感器,采集实验数据,采样频率为12.8 kHz,采集时间为10 s。

    图  15  机械故障模拟实验台
    Figure  15.  Machinery fault simulator

    通过不重叠采样对原始振动信号进行分割,生成的每个样本包含1 024个点,正常、内圈故障、外圈故障、滚动体故障状态各125个样本。采样完成后,对每个样本进行归一化处理。

    由于3 dB噪声环境对滚动轴承故障诊断干扰最为严重,故选取3 dB噪声环境做迁移实验。将1 400,1 800,2 200 r/min 3种转速下的数据集表示为A,B,C,分别用A to B, A to C, B to A, B to C, C to A, C to B表示3种数据集之间的迁移。例如A to B表示源域是转速1 400 r/min下得到的数据集,目标域是转速1 800 r/min下得到的数据集。选取80%的带标签源域样本和80%的无标签目标域样本作为训练集,剩余20%的无标签目标域样本作为测试集。实验使用Radam优化器,学习率为0.01,批量为64,每组实验迭代次数为100,采用5次实验结果的平均值评估方法性能。迁移实验结果如图16所示。

    图  16  3 dB噪声环境下迁移结果
    Figure  16.  Transfer results of 3 dB environment

    图16可看出,在6组不同迁移任务中,DA+AJD方法的识别准确率均高于其他3种方法。

    为综合比较4种方法的迁移能力,取每种方法在6组不同迁移任务下测试结果的平均值进行对比,结果见表6

    表  6  每种方法的平均识别准确率
    Table  6.  Average results of different methods
    方法平均识别准确率/%
    Baseline75.90
    TCA85.38
    DANN87.19
    DA+AJD97.36
    下载: 导出CSV 
    | 显示表格

    表6可知,DA+AJD方法的平均识别准确率比Baseline,TCA和DANN方法的平均识别准确率分别高21.46%,11.98%,10.17%。

    为更加直观地对比每种方法的识别结果,随机选取迁移任务C to B,通过混淆矩阵将目标域B测试集结果可视化,结果如图17所示。可看出DA+AJD方法仅有1个样本被错误识别,而Baseline,TCA和DANN分别有23,14和12个样本被错误识别,表明基于域适应的DA+AJD方法具备更好的故障迁移诊断性能。

    图  17  迁移任务C to B的测试集混淆矩阵
    Figure  17.  Test dataset confusion matrix of transfer task C to B

    为进一步验证DA+AJD方法的优势,利用t−SNE算法将4种方法处理后的源域与目标域特征样本进行可视化,其效果如图18所示。可看出在Baseline方法下,较多目标域的内圈故障和外圈故障特征样本被错误对齐到源域的滚动体故障特征样本区域;TCA方法虽在全局域对齐方面有优势,但未能有效减小条件分布差异,导致仍有一些目标域的内圈故障、外圈故障和滚动体故障特征样本被错误对齐到源域的其他故障特征样本区域;DANN方法也未能有效减少源域与目标域分布差异;DA+AJD方法只有少量目标域的滚动体故障和外圈故障特征样本被错误对齐到源域的内圈故障特征样本区域,说明DA+AJD方法有效地减少了源域与目标域的边缘分布和条件分布差异,达到了更好的特征样本对齐效果。

    图  18  迁移任务C to B的t-SNE特征可视化
    Figure  18.  T-SNE characteristic visualization of transfer task C to B

    为提高噪声背景下深度网络提取轴承信号特征的能力,结合MSCNN网络与BiLSTM网络的优势构建MSCNN−BiLSTM网络作为特征提取网络;为减小源域与目标域数据分布差异,设计了DA训练结合AJD度量机制。

    (1) 抗噪实验表明:在无噪声环境下,MSCNN−BiLSTM网络的识别准确率均达到99%以上,说明其具有较好的特征提取能力;MSCNN−BiLSTM,LeNet−5,MSCNN和BiLSTM的识别准确率随着噪声强度的增强而降低;在3,5,10 dB噪声环境下,MSCNN−BiLSTM网络的平均识别准确率比LeNet−5,MSCNN和BiLSTM 网络的平均识别准确率高,说明MSCNN−BiLSTM网络具有较好的抗噪声干扰性能;MSCNN−BiLSTM网络在无噪声环境和3 dB噪声环境下,均最先达到收敛且波动较小。

    (2) 迁移实验表明:在无标签目标域数据集上,DA+AJD方法的平均识别准确率为97.36%,均高于Baseline,TCA,DANN的识别准确率;在测试集混淆矩阵上,DA+AJD方法仅有1个样本被错误识别,表明基于域适应的DA+AJD方法具备更好的故障迁移诊断性能;利用t−SNE算法对处理后的源域与目标域特征样本进行可视化,DA+AJD方法只有少量目标域的滚动体故障和外圈故障特征样本被错误对齐到源域的内圈故障特征样本区域,说明DA+AJD方法有效地减少了源域与目标域的边缘分布和条件分布差异,达到了更好的特征样本对齐效果。

    (3) 实验中已对滚动轴承振动数据在不同工况下进行迁移实验,但未对不同类型轴承振动数据进行可迁移性分析。下一步将在可迁移性分析的基础上,利用实验室获得的数据对实际工程设备进行迁移诊断。

  • 期刊类型引用(4)

    1. 邬娜,王健,杨建伟,吕百乐. 变工况及小样本情况下滚动轴承故障迁移学习方法综述. 科学技术与工程. 2024(10): 3939-3951 . 百度学术
    2. 陈金路,张翔宇,郑向远,邹荔兵,杨如嫣. 海上风电智能运维关键技术与发展建议. 海洋开发与管理. 2023(06): 117-128 . 百度学术
    3. 蒲米世行,丁浩,杨孟,陈建忠. 基于卷积神经网络的隧道风机健康状态诊断研究. 机电工程. 2023(07): 1121-1129 . 百度学术
    4. 王克定,李敬兆,石晴,胡迪. 基于深度迁移学习的矿井通风机轴承故障诊断. 机床与液压. 2023(22): 209-214 . 百度学术

    其他类型引用(5)

计量
  • 文章访问数:  127
  • HTML全文浏览量:  28
  • PDF下载量:  23
  • 被引次数: 9
出版历程
  • 发布日期:  2021-09-19
  • 刊出日期:  2021-12-28

目录

/

返回文章
返回