基于YOLOv5n−CND的矿用输送带异物检测

孙奥然, 赵培培, 杨迪, 张君逸, 于洪健

孙奥然,赵培培,杨迪,等. 基于YOLOv5n−CND的矿用输送带异物检测[J]. 工矿自动化,2025,51(1):38-44. DOI: 10.13272/j.issn.1671-251x.2024030070
引用本文: 孙奥然,赵培培,杨迪,等. 基于YOLOv5n−CND的矿用输送带异物检测[J]. 工矿自动化,2025,51(1):38-44. DOI: 10.13272/j.issn.1671-251x.2024030070
SUN Aoran, ZHAO Peipei, YANG Di, et al. Foreign object detection for mining conveyor belts based on YOLOv5n-CND[J]. Journal of Mine Automation,2025,51(1):38-44. DOI: 10.13272/j.issn.1671-251x.2024030070
Citation: SUN Aoran, ZHAO Peipei, YANG Di, et al. Foreign object detection for mining conveyor belts based on YOLOv5n-CND[J]. Journal of Mine Automation,2025,51(1):38-44. DOI: 10.13272/j.issn.1671-251x.2024030070

基于YOLOv5n−CND的矿用输送带异物检测

基金项目: 国家重点研发计划项目(2022YFC3004700)。
详细信息
    作者简介:

    孙奥然(2000—),男,江苏徐州人,硕士研究生,研究方向为计算机视觉,E-mail:1974456512@qq.com

    通讯作者:

    赵培培(1979—),女,河北三河人,副教授,博士,研究方向为矿山物联网,E-mail:zppcumt@163.com

  • 中图分类号: TD634.1

Foreign object detection for mining conveyor belts based on YOLOv5n-CND

  • 摘要:

    针对异物图像背景复杂、特征提取能力弱、粘连小目标的检测精度低、检测框定位及尺度失真等问题,提出了一种基于YOLOv5n−CND的矿用输送带目标检测算法。首先,采用C2f对特征金字塔进行优化,使用更少参数解决在井下异物图像采集背景复杂且存在复杂目标干扰对小目标检测不敏感的问题;然后,采用归一化高斯瓦萨斯坦距离(NWD)回归损失函数替代CIoU,改善多尺度异物检测效果不佳的问题,实现粘连小目标的精准检测;最后,添加目标检测头(Dy Head),将尺度、空间和任务3种注意力机制结合,提高对异物轮廓的特征提取能力,增强对多尺度目标的适应能力。实验结果表明:YOLOv5n−CND的mAP@0.5、mAP@0.5∶0.95、参数量及检测速度分别为87.9%,55.9%,4.49×106个,85.5帧/s,满足煤矿井下异物检测需求;YOLOv5n−CND的mAP@0.5和mAP@0.5∶0.95较YOLOv5n分别提高了2.6%和3.4%,较YOLOv5s−CBAM分别提高了1.7%和3.8%;模型参数量在YOLOv5n的基础上略有提升,但较其他模型参数量均有所降低。选取异物与背景相近的细长检测物、光照比较低的锚杆检测物、大量煤矸石混杂的检测物、含有多个异物4种场景进行测试,结果表明:基于YOLOv5n−CND的矿用输送带异物检测算法未出现误检及重复检测的情况,漏检较少,检测框定位准确,对粘连小目标的处理效果更好,能够实现输送带异物的准确检测。

    Abstract:

    To address the issues of complex background in foreign object images, weak feature extraction, low detection accuracy for adhering small objects, and distortion in detection box positioning and scale, a foreign object detection algorithm for mining conveyor belts based on YOLOv5n-CND is proposed. First, the C2f module was used to optimize the feature pyramid, using fewer parameters to address the issue of poor sensitivity to small object detection caused by the complex background in foreign object images and interference from complex objects in underground environments. Second, the normalized Gaussian Wasserstein distance (NWD) regression loss function was used to replace CIoU, improving the performance of multi-scale foreign object detection and accurately predicting the detection of adhering small objects. Finally, a detection head (DyHead) was added, combining three attention mechanisms: scale, spatial, and task, to enhance feature extraction for foreign object contours and improve the adaptability to multi-scale targets. Experimental results demonstrated that YOLOv5n-CND achieved an mAP@0.5 of 87.9%, an mAP@0.5:0.95 of 55.9%, a parameter count of 4.49×106, and a detection speed of 85.5 frames per second, meeting the requirements for underground foreign object detection in coal mines. The mAP@0.5 and mAP@0.5:0.95 of YOLOv5n-CND were 2.6% and 3.4% higher than YOLOv5n, and 1.7% and 3.8% higher than YOLOv5s-CBAM, respectively. Although the model’s parameter count slightly increased compared to the YOLOv5n model, it was still lower than that of other models. Tests were conducted in four scenarios: foreign objects with elongated shapes resembling the background; anchor bolts with relatively low lighting; objects heavily mixed with coal gangue; and multiple foreign objects. The results indicated that the foreign object detection algorithm for mining conveyor belts based on YOLOv5n-CND did not result in false detections or duplicate detections, with very few missed detections. The detection box positioning was accurate, and the handling of adhering small objects was more effective, enabling precise detection of foreign objects on conveyor belts.

  • 煤矿在运输环节常使用矿用输送带,其安全稳定是煤炭运输的重点内容[1-3]。运输中时常夹杂矸石、铁器等异物,易导致输送带撕裂,影响生产安全[4]。及时检测并处理输送带异物对降低安全风险、预防生产停滞、提升经济价值具有重要意义[5]

    采用传统方式[6-8]进行异物检测时,检测精度低且检测速度慢,因此,许多研究人员借助计算机视觉提升目标检测效果。王闰泽等[9]扩大VGG16网络感受野并引入残差结构,以提升网络性能,减少异物漏检,但网络参数调整难度大,模型也不够高效灵活。王超等[10]使用八度卷积代替传统卷积,增强细节特征提取效果,提高了检测精度,但增加了计算量,影响检测速度。吴守鹏等[11]以Faster−RCNN为基础,用双向特征金字塔网络(Double-sided Feature Pyramid Networks,DSFPN)对特征金字塔(Feature Pyramid Networks,FPN)结构进行改进,解决了输送带异物存在多尺度情况影响检测精度的问题,提升了对小块矸石的检测能力和大尺寸异物的识别精度,但DSFPN增加了模型训练的复杂性,降低了模型的收敛速度。雷世威等[12]改进YOLOv3模型,加深网络结构以提升对异物的辨识度,但增大了模型计算量。徐志强等[13]基于模型剪枝技术对相似度高的卷积核进行裁剪,减少了模型冗余,但容易破坏原有结构的完整性,剪枝后的模型对异物特征提取能力不足,检测效果仍有进一步提升的空间。郭永存等[14]采用迁移学习的方式优化煤矸识别模型,改善了尺寸大小及色彩明暗影响异物识别率的问题,但改进后的模型在实验训练过程收敛速度变慢。任志玲等[15]提出了基于改进CenterNet的异物识别方法,降低了煤矸石及铁器误检漏检率,但增加了计算成本和模型参数,且对图像边缘特征提取能力不足。来文豪等[16]选取不同光段构建异物数据集,调整优化YOLOv4网络,将检测时间大幅缩短,但只调整特定波段,难以适应异物检测的复杂环境。李永上等[17]通过添加卷积块注意力机制(Convolutional Block Attention Module,CBAM)改进YOLOv5模型,提升了检测速度,但模型泛化能力减弱。沈科等[18]针对煤块与异物尺寸相对整张图像过小的问题,通过锚框缩放提升检测精度,但对多尺度的特征感知能力减弱,易出现检测框定位不准及尺度失真的情况。郝帅等[19]采用深度可分离卷积改进YOLOv5网络,降低图像模糊对检测的影响,并增强样本数,均衡样本类别降低过拟合风险,减少了模型的参数量,但模型对小目标和粘连异物目标检测效果不佳。

    针对异物图像背景复杂、特征提取能力弱、尺度失真、检测框定位不准等问题,本文在YOLOv5n的基础上进行改进,提出了一种YOLOv5n−CND模型,并应用于煤矿输送带异物检测。采用C2f替换C3模块,提高模型特征提取能力,获得更丰富的梯度流信息;采用归一化高斯瓦萨斯坦距离(Normalized Wasserstein Distance,NWD)损失函数改善预测框回归计算效果差的问题,提高小目标异物的检测精度,减少漏检、误检情况;在头部借助Dy Head,提高对异物轮廓特征的提取能力,避免尺度失真,提升模型检测性能。

    YOLOv5n−CND模型结构如图1所示。

    图  1  YOLOv5n−CND模型结构
    Figure  1.  YOLOv5n-CND model structure

    煤矿井下光照弱、噪声多,图像往往缺失大量的纹理信息,造成YOLOv5n的C3模块提取异物关键特征难,对目标检测效果造成影响。为提高模型对异物检测目标关键特征信息的提取能力,采用C2f模块替换YOLOv5n主干网络中的C3模块。

    C2f包括C2f1和C2f3,如图2所示,其中,C为特征图的大小。C2f1是主干网络中的第8层,主要用于特征图的降维,达到减少计算量的目的。C2f1通过使用1×1卷积核将输入特征图通道减少到1 024,并将特征图尺寸缩小为原来的1/2。C2f3引入残差结构,增强网络的表达能力,使网络更好地学习细节及内部特征。

    图  2  C2f结构
    Figure  2.  C2f structure

    边框损失函数在目标检测任务中主要用来计算观测值与真实值之间的差距。由于YOLOv5n回归损失函数CIoU纵横比描述是一个相对的值,存在一定的模糊,不能精准预测粘连小目标的检测情况。且没有考虑到难易样本平衡的问题,导致难样本无法得到充分学习。针对上述问题,本文引入NWD来替代CIoU,以改善对不同尺度异物不敏感的情况,精准预测粘连小目标的检测情况。

    NWD是一种用于微小目标检测的距离测量方法,能够有效衡量2个对象之间的相似性。NWD将边界框建模为二维高斯分布,通过计算二维高斯分布$ {\mu _1} $和$ {\mu _2} $之间的Wasserstein距离${W}_{2}^{2}\left({\mu }_{1},{\mu }_{2}\right) $,解决检测框重叠问题。

    $$ \begin{array}{c}{W}_{2}^{2}\left({\mu }_{1},{\mu }_{2}\right)={\left|\left|{{\boldsymbol{m}}}_{1}-{{\boldsymbol{m}}}_{2}\right|\right|}_{2}^{2}+{\left|\left|{{\boldsymbol{H}}}_{1}^{\tfrac{1}{2}}-{{\boldsymbol{H}}}_{2}^{\tfrac{1}{2}}\right|\right|}_{{\mathrm{F}}}^{2}\end{array} $$ (1)

    式中:${{\boldsymbol{m}}_1}$,${{\boldsymbol{m}}_2}$为均值向量;${{\boldsymbol{H}}} _1 $和${{\boldsymbol{H}}} _2 $为协方差矩阵;$|| \cdot |{|_{\mathrm{F}}}$为Frobenius范数。

    已知边界框1−$ A=({x}_{{\mathrm{a}}},{y}_{{\mathrm{a}}},{w}_{{\mathrm{a}}},{h}_{{\mathrm{a}}}) $服从高斯分布Na,且边界框2−$ B=({x}_{{\mathrm{b}}},{y}_{{\mathrm{b}}},{w}_{{\mathrm{b}}},{h}_{{\mathrm{b}}}) $服从高斯分布Nb,则

    $$ {W}_{2}^{2}\left({N}_{{\mathrm{a}}},{N}_{{\mathrm{b}}}\right)={\left|\left|{\left[{x}_{{\mathrm{a}}},{y}_{{\mathrm{a}}},\dfrac{{w}_{{\mathrm{a}}}}{2},\dfrac{{h}_{{\mathrm{a}}}}{2}\right]}^{T},{\left[{x}_{{\mathrm{b}}},{y}_{{\mathrm{b}}},\dfrac{{w}_{{\mathrm{b}}}}{2},\dfrac{{h}_{{\mathrm{b}}}}{2}\right]}^{T}\right|\right|}_{2}^{2} $$ (2)

    式中:$ {x}_{{\mathrm{a}}},{y}_{{\mathrm{a}}} $分别为边界框1的横坐标、纵坐标;$ {w}_{{\mathrm{a}}},{h}_{{\mathrm{a}}} $分别为边界框1的宽和高;$ {x}_{{\mathrm{b}}},{y}_{{\mathrm{b}}} $分别为边界框2的横坐标、纵坐标;$ {w}_{{\mathrm{b}}},{h}_{{\mathrm{b}}} $分别为边界框2的宽和高。

    $ {W}_{2}^{2}({N}_{{\mathrm{a}}},{N}_{{\mathrm{b}}}) $仅能表示2个边界框的距离,不能直接表示边界框之间的相似度。因此,将它的指数形式作为Wasserstein 距离的新度量,用来衡量边界框之间的相似度。

    $$ \begin{array}{c}D\left(N_{\rm{a}},N_{\rm{b}}\right)=\mathrm{exp}\left(-\dfrac{\sqrt{W_2^2\left(N_{\rm{a}},N_{\rm{b}}\right)}}{i}\right)\end{array} $$ (3)

    式中:DNaNb)为边界框之间的NWD;i为与数据集密切相关的常数。

    由于YOLOv5n采用了较多卷积层和池化层,算法的计算量大,检测速度慢,单一的检测头又很难适应输送带异物检测任务中不同尺度的目标框和类别信息。采用Dy Head的3种不同注意力对检测头进行改进,实现不同维度协同,获得更大的全局感受野,增强对多尺度目标的适应能力。Dy Head结构如图3所示。

    $$ \begin{array}{c}M\left(E\right)=Q_{\rm{C}}\left\{Q_{\rm{S}}\left[Q_{\rm{L}}\left(E\right)\cdot E\right]\cdot E\right\}\cdot E\end{array} $$ (4)

    式中:ME)为特征张量E的注意力函数;$ Q_{\rm{C}} $为任务感知注意力;$ Q_{\rm{S}} $为空间位置感知注意力;$ Q_{\rm{L}} $为尺度感知注意力。

    图  3  Dy Head结构
    Figure  3.  Dy Head structure

    尺度感知注意力模块通过学习不同语义层级的相对重要性,基于目标的尺度增强适当层级的特征,从而提升目标检测性能。尺度感知注意力模块关注不同尺度的特征图,通过全局池化和卷积操作来生成权重,从而检测头对于不同尺度的目标识别变得更加敏感。

    $$ \begin{array}{c}\pi_{\rm{L}}\left(E\right)\cdot E=\sigma\left(f\left(\dfrac{1}{SG}\eta_{S,G}E\right)\right)\cdot E\end{array} $$ (5)

    式中:σ·)为激活函数;f·)为线性函数;S为空间位置信息;G为通道数;$ \displaystyle\eta_{_{S,G}} $为统计空间位置和通道数中的特征层数。

    空间位置感知注意力模块使特征图变得更为稀疏,最终能够使目标检测网络更好地聚焦于不同位置上的前景目标,从而有效抑制背景噪声,更加突出异物检测主体。由于不同的目标特征位于不同层级,增强特征张量E对于层级位置的表达能力,能够提高检测网络中的空间位置感知能力。通常空间位置信息S的维度很高,需先对其进行解耦,再借助可变形卷积稀疏化学习,最后聚合空间位置信息S在不同层级上的跨尺度特征。

    $$ Q_{\rm{S}}\left(E\right)E=\frac{1}{L}\sum_{l=1}^L\sum_{k=1}^Kw_{l,k}E\left(l;p_k+\Delta p_k;G\right)\Delta m_k $$ (6)

    式中: L为特征图的层次结构;K为稀疏采样的位置数量;wl,k为特定层l与特定采样点k下的权重;$ {p}_{k} $为网络采样位置;$ \Delta {p}_{k}\mathrm{为}\mathrm{位}\mathrm{置}{p}_{k} $的偏移量;$ \Delta {m}_{k} $为在位置$ {p}_{k} $上重要度量因子,主要度量自学习的程度。

    任务感知注意力模块用于促进联合学习及空间表达的泛化能力。被检测目标由于不同特征需要选择不同通道相互配合,特征张量E根据任务控制选择不同通道来增强检测的多样性。可以通过动态地控制开关特征通道来选择不同的任务。

    $$ {Q_{\rm{C}}\left(E\right) \cdot E = \mathrm{max}(\alpha^1 \left(E\right) \cdot E_G + \beta^1\left(E\right),\alpha^2 \left(E\right) \cdot E_G + \beta^2\left(E\right))} $$ (7)

    式中:$ \left(\alpha^{1\ }\beta^1\ \alpha^2\ \beta^2\right)^{\mathrm{T}} $为超函数,用来控制激活阈值;EG为第G个通道的特征切片。

    本文的数据集主要来自煤矿井下输送带及实验室拍摄的图像,少数在实验室内通过仿真实验取得,共获取含有矸石、锚杆、铁器等异物的原始图像2 500张。为提高异物检测模型的鲁棒性与泛化性,采取平移、增噪、旋转、翻折等方式进行数据增强,扩充原始数据集,得到6 279张样本,通过标注工具Labelimg对样本进行标注,将标注好的样本分为训练集和验证集,划分比例为8∶2。数据集划分见表1

    表  1  数据集划分
    Table  1.  Dataset division
    数据集 输送带异物数/个
    矸石 锚杆 铁器
    训练集2 8932 7642 903
    验证集665563886
    总数3 5583 3273 789
    下载: 导出CSV 
    | 显示表格

    本文选用准确率P、召回率R、平均准确率均值mAP@0.5(IoU阈值取50%时的mAP)、mAP@0.5∶0.95(在不同的IoU阈值,从0.5到0.95,步长为0.05上的平均mAP)、每秒传输帧数FPS作为评价指标。

    本文网络模型选用GPU运算服务器作为训练平台,实验系统采用Window10系统;CPU具体型号为Intel(R) Core(TM)i7−7700K CPU@4.20 GHz;GPU型号为NVIDIA GeForce GTX 2080 Ti,显存容量为24 GiB;系统内存为32 GiB;CUDA版本为12.0;PyTorch框架采用1.11.0版本。

    本文使用的训练参数:不添加预训练权重,输入图像大小为640×640;设置epoch为301,batch-size为16,初始学习率为0.01。

    为了验证YOLOv5n−CND的有效性,在相同的训练策略下,对C2f,Dy Head和NWD 3种改进方法进行消融实验,具体结果见表2。改进模型1为YOLOv5n+C2f,改进模型2为YOLOv5n+NWD,改进模型3为YOLOv5n+Dy Head,改进模型4为YOLOv5n+C2f+NWD+Dy Head。

    表  2  消融实验结果
    Table  2.  Ablation experiment results
    模型 C2f NWD Dy
    Head
    P/% mAP@
    0.5/%
    mAP@
    0.5∶0.95/%
    参数
    量/106
    FPS/
    (帧·s−1
    YOLOv5n × × × 86.1 85.3 52.5 3.90 105.5
    改进模型1 × × 88.5 86.7 54.9 4.47 95.8
    改进模型2 × × 87.8 86.0 53.0 3.91 104.0
    改进模型3 × × 87.1 86.0 52.8 4.18 87.5
    改进模型4 91.4 87.9 55.9 4.49 85.5
    下载: 导出CSV 
    | 显示表格

    表2可看出,改进模型1的准确率P,mAP@0.5,mAP@0.5∶0.95较YOLOv5n分别提升了2.4%,1.4%,2.4%,这是由于C2f模块使模型获取了更为丰富的梯度流信息,提高了模型检测准确性。改进模型2的准确率P,mAP@0.5,mAP@0.5∶0.95较YOLOv5n分别提升了1.7%,0.7%,0.5%,且对参数量和检测速度影响较小。改进模型3的准确率P,mAP@0.5,mAP@0.5∶0.95较YOLOv5n分别提升了1.0%,0.7%,0.3%,参数量仅增加了0.28×106个,检测速度也仅下降了18帧/s。改进模型4的准确率P,mAP@0.5,mAP@0.5∶0.95较YOLOv5n分别提升了5.3%,2.6%,3.4%,检测准确率达91.4%,mAP@0.5达87.9%,且满足输送带异物实时检测要求。

    为客观评价YOLOv5n−CND对输送带异物检测的效果,与YOLOv5n,YOLOv5s[20],YOLOv7-tiny[21],YOLOv5s−Ghost,YOLOv5s−ShuffleNetv2,采用高效通道注意力机制(Efficient Channel Attention,ECA)改进YOLOv5s(YOLOv5s−ECA),采用双层路由注意力机制(Bi-Routing Attention, Biformer)改进YOLOv5s(YOLOv5s−Biformer),YOLOv5s−CBAM进行对比,结果见表3

    表  3  对比实验结果
    Table  3.  Comparative experimental results
    模型 mAP@0.5/% mAP@0.5∶
    0.95/%
    参数量/
    106
    FPS/
    (帧·s−1
    YOLOv5n 85.3 52.5 3.90 105.5
    YOLOv5s 86.5 52.8 12.53 94.6
    YOLOv5s−Ghost 85.7 52.5 6.54 101.0
    YOLOv5s−ShuffleNetV2 85.4 52.3 4.73 103.6
    YOLOv5s−ECA 85.8 51.7 7.07 82.2
    YOLOv5s−CBAM 86.2 52.1 8.13 71.3
    YOLOv5s−Biformer 85.9 52.3 7.56 75.6
    YOLOv7-tiny 84.7 51.4 6.03 83.7
    YOLOv5n−CND 87.9 55.9 4.49 85.5
    下载: 导出CSV 
    | 显示表格

    表3可看出,YOLOv5n−CND的mAP@0.5,mAP@0.5∶0.95,参数量及检测速度分别为87.9%,55.9%,4.49×106个,85.5帧/s。YOLOv5n−CND的mAP@0.5和mAP@0.5∶0.95较YOLOv5n分别增长了2.6%和3.4%,较YOLOv5s−CBAM分别提高了1.7%和3.8%;模型参数量在YOLOv5n模型的基础上略有提升,但较其他模型参数量均有所降低。YOLOv5n−CND模型在满足实时检测要求的前提下,不仅增强了检测精度,而且降低了模型参数量。

    为充分验证YOLOv5n−CND的优势,采用基于YOLOv5n−CND的矿用输送带异物检测模型对井下采集的数据进行检测,并与基于YOLOv5s−ECA,YOLOv5s−Biformer,YOLOv5s−CBAM的矿用输送带异物检测模型进行对比。选取异物与背景相近的细长检测物、光照比较低的锚杆检测物、大量煤矸石混杂的检测物、含有多个异物4种场景进行测试,对比结果如图4所示。

    图  4  检测结果对比
    Figure  4.  Comparison of detection results

    图4可看出:① 在较暗的矿井环境下,环境干扰使得待检测目标与背景的灰度值较为接近,给检测造成了干扰,所有模型均检测出异物,但本文模型的置信度最高,较其他3种模型的检测框定位更准确,检测框大小最贴合异物大小,没有出现尺度失真的情况。② 在检测低照度下的不同异物时,YOLOv5s−ECA,YOLOv5s−CBAM,YOLOv5s−Biformer模型及本文模型均存在一定程度的漏检,其中YOLOv5s−CBAM及YOLOv5s−Biformer模型的漏检情况最严重,由于矿工手中的铁钎纹理与背景相似,本文模型对于细长异物的检测需要进一步增强。③ 矸石目标与煤块形状、纹理相似度极高,YOLOv5s−ECA,YOLOv5s−Biformer及YOLOv5s−CBAM模型都出现了不同程度的漏检,YOLOv5s−Biformer模型出现了重复检测和尺度失真的问题,本文模型未出现漏检情况,且置信度相对更高。④ 存在多个异物时,相近目标会造成一定程度的干扰,经常会造成漏检、误检、检测框不够贴合、置信度不高的问题。YOLOv5s−ECA,YOLOv5s−CBAM模型将2个异物识别成1个目标,出现漏检情况,YOLOv5s−Biformer模型出现误检情况,本文模型没有出现漏检、误检情况,且本文模型的检测框对粘连目标的涵盖效果更好,置信度也较高。

    1) YOLOv5n−CND采用C2f模块优化YOLOv5n的特征金字塔结构;采用NWD损失函数改善检测框大小适配问题,降低损失;引入动态检测头,加强对异物轮廓的提取能力。

    2) 在矿用输送带异物数据集上,对YOLOv5n−CND模型进行消融实验,准确率和mAP@0.5,mAP@0.5∶0.95较YOLOv5n分别提升了5.3%,2.6%,3.4%,分别达到了91.4%,87.9%,55.9%,检测速度为85.5帧/s,可满足井下输送带异物实时检测需求。

    3) 选取4种特定场景开展对比实验,结果表明基于YOLOv5n−CND的矿用输送带异物检测模型未出现误检及重复检测的情况,较少漏检,检测框的置信度相对较高,检测框定位准确,对粘连目标的处理效果更好,能够实现输送带异物的准确检测。

  • 图  1   YOLOv5n−CND模型结构

    Figure  1.   YOLOv5n-CND model structure

    图  2   C2f结构

    Figure  2.   C2f structure

    图  3   Dy Head结构

    Figure  3.   Dy Head structure

    图  4   检测结果对比

    Figure  4.   Comparison of detection results

    表  1   数据集划分

    Table  1   Dataset division

    数据集 输送带异物数/个
    矸石 锚杆 铁器
    训练集2 8932 7642 903
    验证集665563886
    总数3 5583 3273 789
    下载: 导出CSV

    表  2   消融实验结果

    Table  2   Ablation experiment results

    模型 C2f NWD Dy
    Head
    P/% mAP@
    0.5/%
    mAP@
    0.5∶0.95/%
    参数
    量/106
    FPS/
    (帧·s−1
    YOLOv5n × × × 86.1 85.3 52.5 3.90 105.5
    改进模型1 × × 88.5 86.7 54.9 4.47 95.8
    改进模型2 × × 87.8 86.0 53.0 3.91 104.0
    改进模型3 × × 87.1 86.0 52.8 4.18 87.5
    改进模型4 91.4 87.9 55.9 4.49 85.5
    下载: 导出CSV

    表  3   对比实验结果

    Table  3   Comparative experimental results

    模型 mAP@0.5/% mAP@0.5∶
    0.95/%
    参数量/
    106
    FPS/
    (帧·s−1
    YOLOv5n 85.3 52.5 3.90 105.5
    YOLOv5s 86.5 52.8 12.53 94.6
    YOLOv5s−Ghost 85.7 52.5 6.54 101.0
    YOLOv5s−ShuffleNetV2 85.4 52.3 4.73 103.6
    YOLOv5s−ECA 85.8 51.7 7.07 82.2
    YOLOv5s−CBAM 86.2 52.1 8.13 71.3
    YOLOv5s−Biformer 85.9 52.3 7.56 75.6
    YOLOv7-tiny 84.7 51.4 6.03 83.7
    YOLOv5n−CND 87.9 55.9 4.49 85.5
    下载: 导出CSV
  • [1] 谢和平,任世华,谢亚辰,等. 碳中和目标下煤炭行业发展机遇[J]. 煤炭学报,2021,46(7):2197-2211.

    XIE Heping,REN Shihua,XIE Yachen,et al. Development opportunities of the coal industry towards the goal of carbon neutrality[J]. Journal of China Coal Society,2021,46(7):2197-2211.

    [2] 樊红卫,刘金鹏,曹现刚,等. 低照度尘雾下煤、异物及输送带早期损伤多尺度目标智能检测方法[J/OL]. 煤炭学报:1-12[2024-01-15]. https://doi.org/10.13225/j.cnki.jccs.2023.0707.

    FAN Hongwei,LIU Jinpeng,CAO Xiangang,et al. Multi-scale target intelligent detection method for coal,foreign object and early damage of conveyor belt surface under low illumination and dust fog[J/OL]. Journal of China Coal Society:1-12[2024-01-15]. https://doi.org/10.13225/j.cnki.jccs.2023.0707.

    [3] 王海军,王洪磊. 带式输送机智能化关键技术现状与展望[J]. 煤炭科学技术,2022,50(12):225-239.

    WANG Haijun,WANG Honglei. Status and prospect of intelligent key technologies of belt conveyor[J]. Coal Science and Technology,2022,50(12):225-239.

    [4] 刘浩,刘海滨,孙宇,等. 煤矿井下员工不安全行为智能识别系统[J]. 煤炭学报,2021,46(增刊2):1159-1169.

    LIU Hao,LIU Haibin,SUN Yu,et al. Intelligent recognition system of unsafe behavior of underground coal miners[J]. Journal of China Coal Society,2021,46(S2):1159-1169.

    [5] 李博,王学文,庞尚钟,等. 煤与矸石图像特征分析及试验研究[J]. 煤炭科学技术,2022,50(8):236-246.

    LI Bo,WANG Xuewen,PANG Shangzhong,et al. Image characteristics analysis and experimental study of coal and gangue[J]. Coal Science and Technology,2022,50(8):236-246.

    [6] 王景起,张驰. 带式输送机防长条形异物保护装置的设计[J]. 起重运输机械,2013(10):90-91.

    WANG Jingqi,ZHANG Chi. Design of elongated foreign material protector for belt conveyor[J]. Hoisting and Conveying Machinery,2013(10):90-91.

    [7] 王哲兴. 煤矿皮带运输异物识别及去除技术研究[J]. 中国石油和化工标准与质量,2022,42(15):87-89.

    WANG Zhexing. Study on the identification and removal technology of foreign body in coal mine belt transportation[J]. China Petroleum and Chemical Standard and Quality,2022,42(15):87-89.

    [8] 孔力,李红,徐恕宏,等. 双能γ射线透射法煤矸石在线识别与分选系统[J]. 华中理工大学学报,1997(10):108-109,113.

    KONG Li,LI Hong,XU Shuhong,et al. The on line identification and separation system for coal gangues based on double energy γ ray transmission[J]. Journal of Huazhong University of Science and Technology,1997(10):108-109,113.

    [9] 王闰泽,郎利影,席思星. 用于智能煤矸分选机器人的改进型VGG网络煤矸识别模型[J]. 煤炭技术,2022,41(1):237-241.

    WANG Runze,LANG Liying,XI Sixing. Improved VGG network coal gangue recognition model for intelligent coal gangue sorting robot[J]. Coal Technology,2022,41(1):237-241.

    [10] 王超,郝博南,张立亚,等. 基于RetinaNet的煤矿井下输送带异物检测技术[J]. 煤矿机械,2022,43(12):180-183.

    WANG Chao,HAO Bonan,ZHANG Liya,et al. conveyor belt roreign object detection technology based on RetinaNet in underground coal mine[J]. Coal Mine Machinery,2022,43(12):180-183.

    [11] 吴守鹏,丁恩杰,俞啸. 基于改进FPN的输送带异物识别方法[J]. 煤矿安全,2019,50(12):127-130.

    WU Shoupeng,DING Enjie,YU Xiao. Foreign body identification of belt based on improved FPN[J]. Safety in Coal Mines,2019,50(12):127-130.

    [12] 雷世威,肖兴美,张明. 基于改进YOLOv3的煤矸识别方法研究[J]. 矿业安全与环保,2021,48(3):50-55.

    LEI Shiwei,XIAO Xingmei,ZHANG Ming. Research on coal and gangue identification method based on improved YOLOv3[J]. Mining Safety & Environmental Protection,2021,48(3):50-55.

    [13] 徐志强,吕子奇,王卫东,等. 煤矸智能分选的机器视觉识别方法与优化[J]. 煤炭学报,2020,45(6):2207-2216.

    XU Zhiqiang,LYU Ziqi,WANG Weidong,et al. Machine vision recognition method and optimization for intelligent separation of coal and gangue[J]. Journal of China Coal Society,2020,45(6):2207-2216.

    [14] 郭永存,王希,何磊,等. 基于TW−RN优化CNN的煤矸识别方法研究[J]. 煤炭科学技术,2022,50(1):228-236.

    GUO Yongcun,WANG Xi,HE Lei,et al. Research on coal and gangue recognition method based on TW-RN optimized CNN[J]. Coal Science and Technology,2022,50(1):228-236.

    [15] 任志玲,朱彦存. 改进CenterNet算法的煤矿皮带运输异物识别研究[J]. 控制工程,2023,30(4):703-711.

    REN Zhiling,ZHU Yancun. Research on foreign object detection of coal mine belt transportation with improved CenterNet algorithm[J]. Control Engineering of China,2023,30(4):703-711.

    [16] 来文豪,周孟然,胡锋,等. 基于多光谱成像和改进YOLO v4的煤矸石检测[J]. 光学学报,2020,40(24):72-80.

    LAI Wenhao,ZHOU Mengran,HU Feng,et al. Coal gangue detection based on multi-spectral imaging and improved YOLOv4[J]. Acta Optica Sinica,2020,40(24):72-80.

    [17] 李永上,马荣贵,张美月. 改进YOLOv5s+DeepSORT的监控视频车流量统计[J]. 计算机工程与应用,2022,58(5):271-279.

    LI Yongshang,MA Ronggui,ZHANG Meiyue. Traffic monitoring video vehicle volume statistics method based on improved YOLOv5s+DeepSORT[J]. Computer Engineering and Applications,2022,58(5):271-279.

    [18] 沈科,季亮,张袁浩,等. 基于改进YOLOv5s模型的煤矸目标检测[J]. 工矿自动化,2021,47(11):107-111,118.

    SHEN Ke,JI Liang,ZHANG Yuanhao,et al. Research on coal and gangue detection algorithm based on improved YOLOv5s model[J]. Industry and Mine Automation,2021,47(11):107-111,118.

    [19] 郝帅,张旭,马旭,等. 基于CBAM−YOLOv5的煤矿输送带异物检测[J]. 煤炭学报,2022,47(11):4147-4156.

    HAO Shuai,ZHANG Xu,MA Xu,et al. Foreign object detection in coal mine conveyor belt based on CBAM-YOLOv5[J]. Journal of China Coal Society,2022,47(11):4147-4156.

    [20] 邢雪凯,刘晨怡,胡国华,等. 基于改进YOLOv5s的安全帽检测算法[J]. 西安文理学院学报(自然科学版),2025,28(1):21-26.

    XING Xuekai,LIU Chenyi,HU Guohua,et al. Helmet detection algorithm based on improved YOLOv5s[J]. Journal of Xi'an University(Natural Science Edition),2025,28(1):21-26.

    [21] 薛晓强,王小勇,李凡卉,等. 基于改进YOLOv7−Tiny的煤矿井下轨道异物检测方法[J/OL]. 光电子· 激光:1-9[2024-01-23]. http://kns.cnki.net/kcms/detail/12.1182.O4.20250109.1516.010.html.

    XUE Xiaoqiang,WANG Xiaoyong,LI Fanhui,et al. Foreign object detection method of underground coal mine track based on improved YOLOv7-Tiny[J/OL]. Journal of Optoelectronics·Laser:1-9[2024-01-23]. http://kns.cnki.net/kcms/detail/12.1182.O4.20250109.1516.010.html.

  • 期刊类型引用(6)

    1. 李刚,刘航,迟国铭,石占山,范永君. 大柳塔煤矿沿空留巷柔模砼墙支护阻力核定及失稳判据研究. 工矿自动化. 2025(01): 145-155 . 本站查看
    2. 贺宏元. 近距离煤层开采底板变形控制方法研究. 凿岩机械气动工具. 2025(02): 58-60 . 百度学术
    3. 王伟. 综采面沿空巷道切顶卸压围岩稳定性控制技术研究. 凿岩机械气动工具. 2025(04): 167-169 . 百度学术
    4. 何浩达,娄培杰. 预裂爆破切顶卸压技术及切顶参数合理选取研究. 河南科技. 2025(07): 34-38 . 百度学术
    5. 吕彦国. 深孔爆破切顶卸压沿空留巷支护技术研究. 建井技术. 2024(06): 1-7 . 百度学术
    6. 孟国龙. 某深部煤层综采工作面切顶卸压留巷技术研究. 现代矿业. 2024(12): 48-51+59 . 百度学术

    其他类型引用(0)

图(4)  /  表(3)
计量
  • 文章访问数:  96
  • HTML全文浏览量:  32
  • PDF下载量:  19
  • 被引次数: 6
出版历程
  • 收稿日期:  2024-03-27
  • 修回日期:  2025-01-19
  • 网络出版日期:  2025-01-09
  • 刊出日期:  2025-01-24

目录

/

返回文章
返回