综采工作面大流量智能供液系统研究

司明, 邬伯藩, 王子谦

司明,邬伯藩,王子谦. 综采工作面大流量智能供液系统研究[J]. 工矿自动化,2022,48(7):66-72. DOI: 10.13272/j.issn.1671-251x.2022030033
引用本文: 司明,邬伯藩,王子谦. 综采工作面大流量智能供液系统研究[J]. 工矿自动化,2022,48(7):66-72. DOI: 10.13272/j.issn.1671-251x.2022030033
SI Ming, WU Bofan, WANG Ziqian. Research on large flow intelligent liquid supply system in fully mechanized working face[J]. Journal of Mine Automation,2022,48(7):66-72. DOI: 10.13272/j.issn.1671-251x.2022030033
Citation: SI Ming, WU Bofan, WANG Ziqian. Research on large flow intelligent liquid supply system in fully mechanized working face[J]. Journal of Mine Automation,2022,48(7):66-72. DOI: 10.13272/j.issn.1671-251x.2022030033

综采工作面大流量智能供液系统研究

基金项目: 国家自然科学基金资助项目(U1261114);陕西省自然科学基础研究计划项目(2019JM-162)。
详细信息
    作者简介:

    司明(1984—),男,宁夏中卫人,高级工程师,硕士,硕士研究生导师,主要研究方向为智能信息处理技术,E-mail:176228107@qq.com

    通讯作者:

    邬伯藩(1997—),男,内蒙古包头人,硕士研究生,主要研究方向为数据挖掘技术, E-mail:1183249012@qq.com

  • 中图分类号: TD355

Research on large flow intelligent liquid supply system in fully mechanized working face

  • 摘要: 针对综采工作面供液系统供液能力不足、压力波动大、系统运行稳定性差等问题,提出了一种免疫粒子群优化模糊神经网络PID(IPSO−FNN−PID)算法,设计了IPSO−FNN−PID控制器,实现了供液系统稳压控制。IPSO−FNN−PID算法将粒子群(PSO)算法和免疫算法(IA)引入模糊神经网络(FNN)PID控制器,针对FNN算法易陷入局部寻优问题,采用免疫粒子群(IPSO)算法优化FNN算法,通过在PSO算法中加入IA来提高PSO算法的收敛性,实现最优PID参数输出。为验证IPSO−FNN−PID控制器的有效性,选取传统PID控制器、Fuzzy−PID控制器、FNN−PID控制器进行比较,仿真结果表明:① IPSO−FNN−PID控制器对乳化液泵的控制效果最佳,其他3种控制器的上升时间、峰值时间和调节时间均比IPSO−FNN−PID控制器长,最大超调量均大于IPSO−FNN−PID控制器。② 在加入扰动信号后,IPSO−FNN−PID控制器具有较好的自适应性和鲁棒性,恢复到平稳状态仅用了1.2 s。③ 当利用传统PID和Fuzzy−PID控制器对乳化液泵进行控制时,振荡明显,超调量大,分别为41.2%,22.3%;当利用FNN−PID控制器对乳化液泵进行控制时,振荡明显减弱,超调量降低为17.6%,调节时间减少至2.68 s;当利用IPSO−FNN−PID控制器对乳化液泵进行控制时,几乎无振荡,超调量仅为5.22%,调节时间缩短至2.61 s,遇到干扰信号时稳定性更强。④ 在受到扰动信号时,负载干扰对IPSO−FNN−PID控制器的影响较小,且收敛迅速,鲁棒性大大提升,表明IPSO−FNN−PID控制器具备良好的抗扰动及扰动补偿能力,可满足供液系统的稳压控制要求。
    Abstract: The liquid supply system in fully mechanized working face has the problems of insufficient liquid supply capacity, large pressure fluctuation and poor system operation stability. In order to solve the above problems, an immune particle swarm optimization fuzzy neural network PID (IPSO-FNN-PID) algorithm is proposed. The IPSO-FNN-PID controller is designed to stabilize the pressure of the liquid supply system. In the IPSO-FNN-PID algorithm, a particle swarm optimization (PSO) algorithm and an immune algorithm (IA) are introduced into a fuzzy neural network (FNN) PID controller. The immune particle swarm optimization (IPSO) algorithm is used to solve the problem that the FNN algorithm is easy to fall into local optimization. The IA is added to the PSO algorithm to improve the convergence of the PSO algorithm. Therefore, the output of the optimal PID parameters is realized. In order to verify the effectiveness of the IPSO-FNN-PID controller, traditional PID controller, Fuzzy-PID controller and FNN-PID controller are selected to compare. The simulation results show that the IPSO-FNN-PID controller has the best control effect on the emulsion pump. The rise time, peak time and regulation time of the other three controllers are longer than the IPSO-FNN-PID controller. The maximum overshoot is greater than the IPSO-FNN-PID controller. After adding the disturbance signal, the IPSO-FNN-PID controller has good adaptability and robustness, and it takes only 1.2 s to restore to a stable state. When traditional PID and Fuzzy-PID controllers are used to control the emulsion pump, the oscillation is obvious and the overshoot is large, which are 41.2% and 22.3% respectively. When the FNN-PID controller is used to control the emulsion pump, the oscillation is significantly weakened, the overshoot is reduced to 17.6%, and the adjustment time is reduced to 2.68 s. When the IPSO-FNN-PID controller is used to control the emulsion pump, there is almost no oscillation. The overshoot is only 5.22%, the adjustment time is shortened to 2.61 s. And the stability is stronger when encountering interference signals. When the disturbance signal is received, the load disturbance has little effect on the IPSO-FNN-PID controller, the convergence is rapid, and the robustness is greatly improved. The results show that the IPSO-FNN-PID controller has good anti-disturbance and disturbance compensation capability, and can meet the pressure stabilization control requirements of the liquid supply system.
  • 智慧矿山建设需要实现矿山数字化、信息化,使其具有辅助或自主决策能力。国家能源局在2024年下发的《煤矿智能化标准体系建设指南》中特别强调[1],智能灾害防治作为煤矿智能化建设的关键环节,其实现需要依托多维度技术支撑。其中,矿山领域知识图谱通过构建结构化的数据网络,为灾害防治提供新的解决方案[2],可帮助工作人员更准确地定位事故原因并提供应对策略。煤矿知识图谱的构建质量直接影响其实际应用效能[3],实体识别作为知识图谱构建过程中必不可少的关键步骤,其精确度直接决定了知识图谱的推理能力。因此,研究煤矿安全事故领域的实体提取,对于完善知识图谱构建和提高矿山智能化决策水平具有重要意义。

    命名实体识别(Named Entity Recognition,NER)[4-5]主要经历了基于规则和词典、基于机器学习和基于深度学习3个阶段的发展。基于规则和词典的方法是利用正则表达式或字符串匹配识别实体,但模型性能受限于规则质量,其效率较低且不具备迁移性。基于机器学习的方法是通过序列标注实现命名实体识别,但其只能处理局部上下文信息。基于深度学习的方法能够自动学习并挖掘文本中特征[6],从而更好地理解和处理自然语言,但研究主要针对字符级别的特征。在通用领域,文献[7]将双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)和随机条件场(Conditional Random Field,CRF)结合应用于实体提取,但BiLSTM−CRF模型不能获取输入句子的全局信息。文献[8]提出了一种融入实体级和句子级语义信息的预训练卷积神经网络模型,提高了预训练模型的实体抽取准确率,但未能进行标签约束。文献[9]将字符、词性和词典特征融合,使用BiLSTM 和多头注意力提取全局与局部特征,但是多头注意力的计算开销大。在煤矿领域,文献[10]结合轻量级双向编码器表示模型和迭代扩张卷积,在自建煤矿领域数据集上对煤矿事故案例进行抽取,但是扩张卷积可能丢失细粒度特征。文献[11]构建了煤矿事故领域词典,提出了一种结合轻量级双向编码器表示模型和BiLSTM−CRF模型的实体提取算法,但是忽略了领域词汇的特征。文献[12]基于自建装备维护语料库,提出双向编码器表示模型(Bidirectional Encoder Representations from Transformers,BERT)的垂直领域命名实体识别方法,但是仍然存在中文实体提取词汇边界模糊的问题。文献[13]提出基于预训练语言模型的煤矿安全隐患命名实体识别方法,证明双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU) 有助于捕捉上下文依赖关系,但是模型提取效果受限于知识集成增强表示(Enhanced Representation through kNowledge IntEgration,ERNIE)预训练质量。此外,大语言模型(Large Language Models,LLMs)[14]也在实体抽取任务中展现了优势[15-19],但其目前仍存在生成内容与事实不符的问题。现有实体提取模型对词汇信息利用不充分,但是领域专业词汇在中文语义表达中占据主要地位,因此研究融合词汇信息的实体提取模型显得至关重要。

    针对实体提取词汇信息利用不充分的问题,本文以《煤矿安全规程》、煤矿安全标准规范和事故案例等为基础,构建包含12类概念及概念之间关系的煤矿安全事故本体模型。首先,基于Linux系统的标注工具Brat进行语料标注,得到煤矿安全事故数据集。其次,采用优化BERT(Robustly Optimized BERT Pretraining Approach,RoBERTa)模型获取字符特征向量,通过全局词向量(Global Vectors,GloVe)获取词汇特征向量,利用AC自动机(Aho-Corasick Automation)进行字词匹配,采用自注意力机制融合字符特征和词汇特征,充分利用词汇信息提升模型的实体边界识别能力。然后,使用融合词汇信息的RoBERTa−BiLSTM−CRF模型,在自建数据集上开展基于深度学习的煤矿安全事故命名实体识别研究。最后,对融合词汇信息的实体提取模型进行对比实验,以评估该模型在煤矿安全事故知识提取任务中的性能。

    本体是一种知识表示方法,构建本体模型的核心是明确领域中的概念、概念的层次、概念的属性和约束。本文采用斯坦福大学开发的七步法构建领域本体模型[20],利用Protege工具构建煤矿安全事故本体模型。确定本体领域范围为掘进工作面、采煤工作面及煤矿安全监控系统;复用已有煤矿本体[20],总结得到煤矿灾害、操作、人员、设备、环境和组织6类煤矿领域通用概念;结合《煤矿安全规程》和领域术语标准获取领域知识;确定本文煤矿安全事故领域的核心概念及其层次,如图1所示,定义概念间属性及约束;评价本体的有效性。

    图  1  煤矿安全事故本体模型
    Figure  1.  Ontology model of coal mine safety accident

    每一类概念所考虑的具体因素见表1。以煤矿安全事故为研究对象,在已有煤矿本体的煤矿灾害概念基础上,确定事故灾害的概念;在已有煤矿本体的人员和操作概念基础上,确定工作人员和人员操作2类概念,其中采煤施工、防治措施、救援善后是人员操作的3个子类概念;在已有煤矿本体的设备概念基础上,确定机电设备的概念;在已有煤矿本体的环境概念基础上,确定空间位置、大气环境、地质条件3类概念;在已有煤矿本体的组织概念基础上,确定数据参数、安全管理、组织机构3类概念。

    煤矿安全事故领域的低价值文本数据包含大量领域关键实体,因此文本数据挖掘需要煤矿安全事故实体标注。基于煤矿安全事故本体,本文提出煤矿安全事故命名实体标注方法(表1)。将本体模型中12个概念类转换为实体类,概念类与实体类在不同理论框架中的名称不同,但二者表示的语义信息并未发生改变。尽管定义的12类实体标签未必能全面覆盖煤矿安全事故的所有信息,但实体及其关系所构成的语义信息网络框架可以覆盖整个领域核心信息。

    表  1  命名实体标注
    Table  1.  Scheme of named entity annotation
    序号 实体 标签 实例 备注
    1 事故灾害 Accident 水灾事故 研究对象
    2 采煤施工 Method 掘进作业 人员操作
    3 防治措施 Prevention 顶板维护 人员操作
    4 救援善后 Rescue 抢排水 人员操作
    5 工作人员 Person 采掘工 工作人员
    6 机电设备 Facility 掘进机 机器
    7 空间位置 Place 掘进工作面 环境
    8 大气环境 Atmospheric 瓦斯 环境
    9 地质条件 Geology 煤层厚度 环境
    10 数据参数 Parameters 每班,每周 管理
    11 安全管理 Management 综合应急预案 管理
    12 组织机构 Organization 抢险救援指挥部 管理
    下载: 导出CSV 
    | 显示表格

    基于建立的本体模型对煤矿安全事故数据集进行BIO实体标注。人工标注存在一定主观性,训练模型可能会出现未标注的新词。Brat(Brat Rapid Annotation Tool)是基于Linux系统的网页化标注工具,用于文本文档添加注释和标签[21]。Brat可进行实体和关系双任务标注,支持多人标注,标注界面简洁,标注修改方便。因此,本文采用Brat进行实体标注,组长根据所有成员标注的语料库草稿,校正并合成一份高质量煤矿安全事故语料库。

    煤矿安全事故领域的文本数据种类繁多,包括研究论文、行业标准、法律文件、事故案例报告等。通过爬取煤易联和煤矿安全网等官方网站数据,获取煤矿安全事故相关文本资料,作为领域实体提取的文本数据集。构建煤矿安全事故文本数据集,包括《煤矿安全规程》和通过官网爬取得到的231篇煤矿安全事故相关文本资料。对获取的文本数据进行预处理,采用正则表达式匹配技术剔除非文本元素,通过文档结构分析去除页眉注释、参考文献等非主体内容,将处理后的文本统一转换为TXT格式文件,实现文本数据的初步清洗。煤矿安全事故领域文本呈现显著的专业词汇特征,存在大量复合型专业词汇,例如“瓦斯异常涌出”“采掘工作面”“甲烷传感器”等。对于字词较长的专业词汇可能会被拆分为若干短词,例如,“甲烷传感器”可能被拆分为缺乏信息的“甲烷”“传感器”,将不能全面地描述煤矿领域专业设备的含义,进而影响实体边界识别的精度。基于预处理之后的领域文本构建煤矿安全领域专业词典,作为字词匹配和实体提取研究的词汇基础。

    在处理命名实体识别任务时,模型训练需要依赖大规模标注语料库,通过预训练语言和序列标注实现命名实体识别。本文提出融合词汇信息的RoBERTa−BiLSTM−CRF实体提取模型。首先,构建煤矿安全领域专业词典,利用AC自动机算法[22]进行字词匹配,得到字符对应的潜在词汇。然后,通过自注意机制分配权重,将基于RoBERTa模型得到的字符向量和基于GloVe模型得到的词汇向量进行融合,得到包含词汇信息的融合向量。最后,将融合向量作为BiLSTM−CRF层的输入,得到最优预测序列结果,实现实体提取。融合词汇信息的实体提取模型整体框架如图2所示,其中$({{\boldsymbol{u}}^{\mathrm{w}}_i},{{\boldsymbol{v}}^{{\mathrm{wl}}}_i}) $为字词对序列的向量形式,$ \boldsymbol{z}_i $为融合向量,$ \boldsymbol{l}_i $为前项特征向量,$ \boldsymbol{b}_i $为后项特征向量,$ \boldsymbol{h}_i $为包含远近距离信息的融合向量。

    图  2  融合词汇信息的实体提取模型整体框架
    Figure  2.  Overall framework of entity extraction model integrating lexical information

    煤矿领域专业词汇包含了更加丰富的语义信息,可以提供模型所需要的实体边界,有利于提高实体提取准确率[23]。考虑上述词汇语义信息的作用,在实体提取时引入词汇向量信息,通过字词向量匹配实现专业词汇和目标字符信息的对齐。AC自动机算法扫描1次就可以匹配包含目标字符的所有潜在词汇,匹配效率较高,因此本文采用AC自动机算法实现字词匹配,分为获取词向量、构建Trie树、构建自动机和匹配词汇4个步骤,如图3所示。

    图  3  字词向量匹配流程
    Figure  3.  Process of word-character vector matching

    从煤矿科技术语中获取领域词汇,构建煤矿安全专业词典。基于GloVe模型[24]将词汇文本转换为词汇向量,设定向量维度为100维,共得到8 594个词向量。初始状态Trie树仅有根节点root,将待匹配词汇依次按字符添加到Trie树中,若无指向当前字符节点则创建节点;若存在则标记该节点为已访,继续访问下一个字符,直到词汇最后一个字符插入完成。对于构建完成的Trie树进行广度优先遍历,将其扩展为AC自动机,以“远距离爆破掘进”“掘进工作面”“掘进机”为例,可以得到AC自动机状态(图4)。为每个节点添加标志指针fail和后缀子串链表,主串匹配失败时进行状态转移,指向可行后缀节点。设$ {w}_{i} $为句子中第$ i $个字符,且字符数为$ n $,则输入句子为$ s=\{{w}_{1},{w}_{2},\cdots ,{w}_{n}\} $。基于AC自动机实现词典匹配后,可以得到句子中每一个字符$ {w}_{i} $所对应的所有潜在词汇。若用$ w{f}_{i} $表示句子中包含字符$ {w}_{i} $的所有词汇组成的集合,则可将句子转换为字词对$ s=\left\{\left({w}_{1},w{f}_{1}\right),\left({w}_{2},w{f}_{2}\right),\cdots ,\left({w}_{n},w{f}_{n}\right)\right\} $的形式。

    图  4  AC自动机状态
    Figure  4.  States of AC automaton

    传统词汇信息引入方法主要依赖中文分词工具,如果分词结果不准确,将会直接导致实体边界识别错误,进而影响整体模型表现。为了解决该问题,本文基于字词匹配得到的字词对,将字符级特征和词汇级特征进行融合,从而充分利用词汇信息。特征融合不仅能够提升实体提取模型对字符级和词汇级信息的捕捉能力,还能有效解决煤矿安全事故实体边界不清晰的问题,提高模型在实体识别任务中的表现。字词特征向量融合包括特征对齐、特征降维和特征融合3个步骤,如图5所示。

    图  5  字词特征向量融合流程
    Figure  5.  Process of word-character feature vector fusion

    字词对序列的向量形式$ ({\boldsymbol{u}}_{i}^{{\mathrm{w}}},{\boldsymbol{v}}_{i}^{{\mathrm{wl}}}) $中,$ {\boldsymbol{u}}_{i}^{{\mathrm{w}}} $为RoBERTa层输出的第$ i $个字符向量,$ {\boldsymbol{v}}_{i}^{{\mathrm{wl}}}= $为第$ i $个字符所对应的所有潜在词向量,$ {\boldsymbol{v}}_{i}^{{\mathrm{w}}} $中第$ j $个词向量可以表示为$ {\boldsymbol{v}}_{ij}^{{\mathrm{w}}} $,$j=1,2\cdots,m $,m为词向量个数。此时,字符向量$ {\boldsymbol{u}}_{i}^{{\mathrm{w}}} $维度为1 024,词向量$ {\boldsymbol{v}}_{ij}^{{\mathrm{w}}} $维度为100,二者维度不相同,需要变换词向量的维度进行特征对齐操作。通过线性变换和激活函数,提取和转换输入词向量的特征,将低维输入映射到高维空间,使字符向量和词向量的维度保持一致,对齐后的词向量为

    $$ {\boldsymbol{p}}_{ij}^{{{{\mathrm{w}}}}}={\boldsymbol{W}}_{2}({\mathrm{tanh}}({{\boldsymbol{W}}}_{1}{\boldsymbol{v}}_{ij}^{{\mathrm{w}}}+{b}_{1}))+{b}_{2} $$ (1)

    式中:$ {\boldsymbol{W}}_{1} $,$ {\boldsymbol{W}}_{2} $为参数矩阵,维度分别为$ {d}_{{\mathrm{w}}}\times {d}_{{\mathrm{wl}}} $,$ {d}_{{\mathrm{w}}}\times {d}_{{\mathrm{w}}} $,$ {d}_{{\mathrm{w}}} $,$ {d}_{{\mathrm{wl}}} $分别为字符向量和词向量维度;b1b2为偏置项。

    输入句子的每个字符一般都匹配多个词汇,例如特征对齐后句子中第$ i $个字符对应的词向量为$ {\boldsymbol{P}}=\{{\boldsymbol{p}}_{i1}^{{\mathrm{w}}},{\boldsymbol{p}}_{i1}^{{\mathrm{w}}},\cdots ,{\boldsymbol{p}}_{im}^{{\mathrm{w}}}\} $。因此需要对多个词汇组成的二维词向量集合进行降维操作,以便与字符向量进行特征融合。自注意力机制通过计算序列中每一个词向量与其他位置词向量之间的相关性,为不同位置词向量分配不同的权重,将每个词向量与对应的注意力权重进行加权求和,获取特征降维后的加权输出。

    词向量集合中每一词向量$ {{\boldsymbol{p}}}^{ij} $分别乘以查询注意力权重矩阵$ {\boldsymbol{W}}_{{\mathrm{att}}}^{q} $和键注意力权重矩阵$ {\boldsymbol{W}}_{{\mathrm{att}}}^{k} $,得到当前词向量与其他词向量之间的关系$ {q}^{ij} $、当前词向量的关键信息$ {k}^{ij} $,$ {q}^{ij} $和$ {k}^{ij} $隐藏层设置为768个神经元。

    $$ {q}^{ij}={\boldsymbol{W}}_{{\mathrm{att}}}^{q}{{\boldsymbol{p}}}^{ij} $$ (2)
    $$ {k}^{ij}={\boldsymbol{W}}_{{\mathrm{att}}}^{k}{{\boldsymbol{p}}}^{ij} $$ (3)

    由于词汇由多个字符构成,不同字符在同一个词汇中的重要程度也不相同,所以在计算词向量权重时需要融合字符向量信息。例如,对于输入句子“串联工作面的巷道中必须装设甲烷传感器”中字符“烷”,匹配的词汇可能包括“甲烷”和“甲烷传感器”,结合上下文可知本句中“甲烷传感器”的重要程度高于“甲烷”,因此将会分配更高的注意力权重。$ {\alpha }_{ij} $为句子中第$ i $个字符对应的第$ j $个词向量的权重,词向量集合中每个词向量的权重为$ A= \{{\alpha }_{i1},{\alpha }_{i2},\cdots ,{\alpha }_{im}\} $。

    $$ A=\mathrm{softmax}\left(\boldsymbol{u}_i^{\mathrm{w}}\frac{\left(\boldsymbol{W}_{\mathrm{att}}^q\boldsymbol{P}\right)\times(\boldsymbol{W}_{\mathrm{att}}^k\boldsymbol{P})^{\mathrm{T}}}{\sqrt{d_{\mathrm{w}}}}\right) $$ (4)

    将得到的注意力权重$ {\alpha }_{ij} $和词向量$ {\boldsymbol{p}}_{ij}^{{\mathrm{w}}} $相乘之后再累加,得到该字符的词向量$ {\boldsymbol{r}}_{i}^{{\mathrm{w}}} $,即融合了词汇集合中所有词汇信息的加权词向量,实现二维词向量集合降维操作。

    $$ {\boldsymbol{r}}_{i}^{{\mathrm{w}}}=\sum_{j=1}^{m}{\alpha }_{ij}{\boldsymbol{p}}_{ij}^{{\mathrm{w}}} $$ (5)

    加权词向量与字符向量的维度相同,将二者归一化,得到字词特征融合向量$ {{\boldsymbol{z}}_i} $。

    $$ {{\boldsymbol{z}}}_{i}=\varepsilon {\boldsymbol{u}}_{i}^{{\mathrm{w}}}+(1-\varepsilon ){\boldsymbol{r}}_{i}^{{\mathrm{w}}} $$ (6)

    式中$ \varepsilon $为归一化权重,$ \varepsilon $=0.7。

    将融合向量$ {{\boldsymbol{z}}_i} $输入BiLSTM层,分别得到前项特征向量$ {{\boldsymbol{l}}_i} $和后项特征向量$ {{\boldsymbol{b}}_i} $,最终获取包含远近距离信息的融合向量$ {{\boldsymbol{h}}_i} $,实现融合词汇信息的煤矿安全事故实体提取。

    RoBERTa层输入为句子文本信息,输出为每一个字符的特征向量,实现了获取字符级嵌入的功能。RoBERTa模型是基于BERT改进的采用动态掩码策略的双向编码器预训练语言表征[25],能够深入理解上下文信息,输入向量由字向量${\boldsymbol{E}}_{{\mathrm{ui}}} $、句子向量${\boldsymbol{E}}_{\mathrm{A }}$和位置向量${\boldsymbol{E}}_{\mathrm{i}} $3个部分组成,并添加开始与结束的特殊标记,如图6所示。

    图  6  RoBERTa模型的输入向量
    Figure  6.  Input vectors for RoBERTa model

    字词融合层将由字词匹配模块得到的字词对和由RoBERTa层得到的字向量作为输入,输出为融合词汇信息的融合向量,实现了融合词汇信息的功能。字词匹配模块将字符向量和潜在词向量集合组成字词对,把词向量集合转换为与字符向量维度相同的向量,将字符向量与加权词向量进行归一化融合,得到包含词信息的融合字词向量。

    BiLSTM层将包含词汇信息的融合向量作为输入,输出包含近距离和远距离信息的每一个字符属于某一类实体类型的概率,实现获取长距离语义信息的功能。BiLSTM模型添加反向传输层,解决了LSTM模型无法同时处理上下文信息的问题[26],结合前向和反向输出结果对数据集进行特征提取。

    CRF层将BiLSTM层输出作为输入,最终输出概率分数最高的预测序列,实现了对模型输出进行标签约束的功能。CRF模型是一种判别式模型,在实际应用中通常用于序列标注任务。CRF通过确定下一个标签概率,在最终结果上对输出标签之间的关系做一定约束,从而补偿BiLSTM不能处理相邻标签依赖的问题[7]

    采用融合词汇信息的RoBERTa−BiLSTM− CRF实体提取模型(图2),开展煤矿安全事故领域的文本命名实体识别。模型主要包含RoBERTa字符嵌入层、字词融合层、BiLSTM层和CRF层,各层参数设置见表2,其中,batch size和句子最大长度依据输入数据集规模和设备效率确定;标签的数量和转移矩阵维度基于数据集实体数量确定;嵌入向量维度考虑数据集大小和各层模型需求设定;Transformer层、隐藏层和多头注意力机制分别参考BERT−base模型和字词融合层向量维度确定;词向量维度基于词汇集合规模确定;LSTM层数依据数据集大小设定;dropout、学习率及归一化参数通过训练调优确定。所有参数分为3类:可直接确定的参数(如batch size、句子最大长度、标签数量等)、参考现有研究确定的参数(如Transformer层、隐藏层等)及通过训练调优确定的参数(如dropout、学习率等)。

    表  2  RoBERTa−BiLSTM− CRF实体提取模型参数设置
    Table  2.  Parameters for RoBERTa-BiLSTM-CRF entity extraction model
    参数 RoBERTa层 字词融合层 BiLSTM层 CRF层
    batch size 32
    句子最大长度 256
    标签的数量 12 12
    转移矩阵维度 14×14
    嵌入向量维度 1024 1024 1024 1024
    Transformer层 12
    隐藏层 768 768 128
    多头注意力机制 12 12
    词汇向量维度 100
    LSTM层数 2
    dropout 0.1 0.1 0.5
    学习率 3×10−5 3×10−5 1.5×10−3
    归一化参数 0.7
    下载: 导出CSV 
    | 显示表格

    为规范标注和区分训练语料中实体,在实体模型训练过程中随机选取子集进行细致修改。先从Brat导出ann文件,将其转入有BIO标签的conll文件,再进一步转换为json文件。使用融合词汇信息的RoBERTa−BiLSTM−CRF模型训练实体识别器,从规范后的语料库子集中共得到6 564个实体,将所提取的实体按类存入Neo4j图数据库。机电设备和空间位置是事故安全语料库的重要组成部分,语料库包括1 721个机电设备类实体和1 127个空间位置类实体。煤矿安全事故各类实体中空间位置的标签数量最多,组织机构的标签数量最少。可以在Neo4j图知识库中查询不同实体类型包含的所有实体,空间位置类的部分实体如图7所示。

    图  7  空间位置类实体(部分)
    Figure  7.  Partial examples of spatial location entities

    采用自建的煤矿安全事故语料集作为数据集,按照8∶1∶1比例将数据集分为训练集、测试集、验证集。在煤矿安全事故实体抽取中,以句子为单位对划分的数据集进行分割,训练时以句子为最小单位进行输入,不考虑句子和段落之间的语义关系。

    选择信息检索系统通用评价标准中的精确率、召回率和F1作为模型性能的评估指标。精确率和召回率2个指标的结合使用可以全面评估模型在预测正类上的表现。F1是精确率和召回率的调和平均值,F1越高表明模型的精确率和召回率越平衡,模型性能越好。

    为了验证融合词汇信息的有效性及RoBERTa−BiLSTM−CRF模型各个结构作用,将本文提出的融合模型分别与BiLSTM−CRF,RoBERTa−Softmax,RoBERTa−CRF,RoBERTa−BiLSTM−CRF等单独提取了一部分的模型进行比较,不同模型在训练时的F1图8所示,预测结果如图9所示。

    图  8  不同模型训练时的F1
    Figure  8.  F1-scores during training of different models
    图  9  不同模型的预测结果
    Figure  9.  Prediction results across different models

    图8图9可看出:RoBERTa−Softmax模型的F1较BiLSTM−CRF模型提升了14.08%,表明预训练可以显著提升模型的F1;RoBERTa−CRF模型的F1较RoBERTa−Softmax模型提高了1.61%,表明利用CRF加入标签约束可以有效提高模型性能;融合词汇信息的RoBERTa−BiLSTM−CRF模型的F1较传统RoBERTa−BiLSTM−CRF模型提高了1.63%,表明词汇信息的加入有利于提高实体提取模型性能。可见,RoBERTa层解决了实体提取过程中上下文语义信息不全问题,融合层解决了词汇信息不全问题,BiLSTM层解决了一词多义问题,CRF层解决了标签约束问题。

    不同模型的实体提取结果见表3,12种实体类型提取的F1表4。可看出词汇信息的融合RoBERTa−BiLSTM−CRF模型在整体实体提取任务及各类实体类型的提取中,综合性能优于其他模型,表明该模型的整体性能优势能有效迁移到各类实体提取任务中,反映出模型架构设计对不同实体类型具有广泛适用性。该模型对于防治措施、工作人员和地质条件3种实体提取的F1较RoBERTa−BiLSTM−CRF模型低,这是由于数据集中不同标签的数量分布不均匀,防治措施、工作人员和地质条件3类实体的规模在数据集中排序相对靠后。

    表  3  不同模型的实体提取结果
    Table  3.  Entity extraction performances across different models s %
    模型 F1 精确率 召回率
    BiLSTM−CRF 70.83 71.53 70.14
    RoBERTa−Softmax 84.91 85.64 84.19
    RoBERTa−CRF 86.52 87.46 85.6
    RoBERTa−BiLSTM−CRF 90.00 91.91 88.17
    本文模型 91.63 92.38 90.89
    下载: 导出CSV 
    | 显示表格
    表  4  12种实体类型提取的F1
    Table  4.  F1-scores for 12 entity categories
    概念类 数量/个 F1/%
    BiLSTM−
    CRF
    RoBERTa−
    Softmax
    RoBERTa−
    CRF
    RoBERTa−
    BiLSTM−CRF
    本文
    模型
    事故灾害 524 64.50 78.82 80.53 84.16 85.69
    采煤施工 613 63.78 77.98 79.77 83.20 84.83
    防治措施 515 65.83 80.00 81.75 87.38 86.99
    救援善后 209 70.33 87.56 86.60 90.43 91.87
    工作人员 185 76.22 85.41 92.43 98.38 97.84
    机电设备 1721 76.06 84.72 93.72 94.19 95.41
    空间位置 1127 72.94 90.68 88.73 92.28 93.88
    大气环境 158 67.09 81.65 83.54 87.34 89.24
    地质条件 253 69.96 84.58 86.56 92.09 91.70
    数据参数 758 71.11 88.65 87.07 90.50 92.22
    安全管理 432 73.15 91.90 92.59 92.82 94.44
    组织机构 69 73.91 86.96 89.86 98.55 100.00
    下载: 导出CSV 
    | 显示表格

    1) 融合词汇信息的RoBERTa−BiLSTM−CRF模型综合了人、机、物、环、管5个关键要素,涵盖了12类核心概念,全面覆盖了煤矿安全领域的主要信息。通过手工标注并校正形成了一个高质量的煤矿安全事故语料库,为后续的文本分析和实体识别提供了坚实的基础。

    2) 采用AC自动机算法进行精确的字词匹配,结合GloVe模型将文本转换为高维词汇特征向量,并利用RoBERTa模型深入提取字符级特征。此外,引入煤矿安全领域的专业词典,通过注意力机制将字符级和词汇级特征有效融合,显著提升了模型对关键信息的捕捉能力。

    3) 融合词汇信息的RoBERTa−BiLSTM−CRF模型对煤矿安全领域12种实体提取的F1达91.63%,较RoBERTa−BiLSTM−CRF提高了1.63%。

  • 图  1   供液系统结构

    Figure  1.   Liquid supply system structure

    图  2   IPSO−FNN−PID控制器

    Figure  2.   IPSO-FNN-PID controller

    图  3   输入变量和输出变量的隶属度函数曲线

    Figure  3.   Membership function curves of input and output variable

    图  4   IPSO算法粒子寻优位置

    Figure  4.   IPSO algorithm particle optimization position

    图  5   各控制器阶跃响应曲线

    Figure  5.   Step response curve of each controller

    图  6   各控制器扰动仿真结果

    Figure  6.   Disturbance simulation results of each controller

    表  1   模糊控制规则

    Table  1   Fuzzy control rules

    EC E
    NBNMNSZOPSPMPB
    NBPBPBPMPMPSPSZO
    NMPBPMPMPSPSZONS
    NSPMPMPSPSZONSNS
    ZOPMPSPSZONSNSNM
    PSPSPSZONSNSNMNM
    PMPSZONSNSNMNMNB
    PBZONSNSNMNMNBNB
    下载: 导出CSV

    表  2   各控制器PID控制参数及动态特性比较

    Table  2   Comparison of PID control parameters and dynamic characteristics of each controller

    控制器${K}_{{\rm{p}}}$${K}_{{\rm{i}}}$${K}_{{\rm{d}}}$$ \mathrm{\sigma } $/%${t}_{{\rm{r}}}$/s${t}_{{\rm{p}}}$/s${t}_{{\rm{s}}}$/s
    PID3.2154.5834.11241.21.011.713.72
    Fuzzy−PID0.6912.8923.67222.31.341.633.56
    FNN−PID0.8823.0003.12717.60.981.552.68
    IPSO−FNN−PID1.2182.6143.7455.220.891.312.61
    下载: 导出CSV
  • [1] 付翔,王然风. 基于意识−情感−智能三位一体的煤矿供液过程控制[J]. 智能系统学报,2018,13(4):640-649.

    FU Xiang,WANG Ranfeng. Hydraulic fluid supply process control of coal mine based on consciousness, emotion,and intelligence[J]. CAAI Transactions on Intelligent Systems,2018,13(4):640-649.

    [2] 王国法. 煤矿智能化最新技术进展与问题探讨[J]. 煤炭科学技术,2022,50(1):1-27.

    WANG Guofa. New technological progress of coal mine intelligence and its problems[J]. Coal Science and Technology,2022,50(1):1-27.

    [3] 李然. 大采高工作面高压大流量乳化液泵的研制及应用[J]. 煤炭科学技术,2017,45(12):145-149.

    LI Ran. Research and development as well as application of high pressure and high flow emulsion pump to large mining height face[J]. Coal Science and Technology,2017,45(12):145-149.

    [4] 李然,王伟. 综采集成供液系统智能监测诊断技术现状与发展[J]. 煤炭科学技术,2016,44(3):91-95.

    LI Ran,WANG Wei. Status and development of intelligent monitoring and diagnosis technology for fully mechanized integrated pressure pumping system[J]. Coal Science and Technology,2016,44(3):91-95.

    [5] 罗文,杨俊彩. 神东矿区薄煤层安全高效开采技术研究[J]. 煤炭科学技术,2020,48(3):68-74.

    LUO Wen,YANG Juncai. Study on safety and efficient mining technology of thin coal seam in Shendong minging area[J]. Coal Science and Technology,2020,48(3):68-74.

    [6] 李然. 综采工作面智能供液技术及发展趋势[J]. 煤炭科学技术,2019,47(9):203-207.

    LI Ran. Intelligent fluid supply technology in fully-mechanized coal mining face and its development trend[J]. Coal Science and Technology,2019,47(9):203-207.

    [7] 李永明. 采煤工作面集中配液及远程供液系统应用[J]. 煤炭科学技术,2021,49(增刊1):183-187.

    LI Yongming. Application of centralized liquid distribution and remote liquid supply system in coal mining face[J]. Coal science and technology,2021,49(S1):183-187.

    [8] 张占东,张榕慧,姚利花,等. 面向液压支架动作过程的乳化液泵站多泵并联供液技术研究[J]. 煤矿机械,2019,40(10):35-37.

    ZHANG Zhandong,ZHANG Ronghui,YAO Lihua,et al. Study on multi-parallel pumps fluid feeding technology of emulsion pump station oriented to hydraulic support movement process[J]. Coal Mine Machine,2019,40(10):35-37.

    [9] 杨国来,朱礼浩,张晓丽,等. 乳化液泵的理论分析与数值模拟[J]. 液压与气动,2015(5):86-88,108. DOI: 10.11832/j.issn.1000-4858.2015.05.019

    YANG Guolai,ZHU Llihao,ZHANG Xiaoli,et al. Theoretical analysis and numerical simulation of emulsion pump[J]. Chinese Hydraulics & Pneumatics,2015(5):86-88,108. DOI: 10.11832/j.issn.1000-4858.2015.05.019

    [10] 石建华,刘漫贤,张兆杰,等. 矿用乳化液泵站智能化改造与应用[J]. 煤矿机械,2021,42(2):139-141. DOI: 10.13436/j.mkjx.202102044

    SHI Jianhua,LIU Manxian,ZHANG Zhaojie,et al. Intelligent transformation and application of mine emulsion pump station[J]. Coal Mine Machine,2021,42(2):139-141. DOI: 10.13436/j.mkjx.202102044

    [11] 陈伟,王存飞,边燕. 超大采高综采工作面乳化液泵站系统[J]. 工矿自动化,2021,47(4):6-12. DOI: 10.13272/j.issn.1671-251x.2020120020

    CHEN Wei,WANG Cunfei,BIAN Yan. Emulsion pump station system for super high fully mechanized working face[J]. Industry and Mine Automation,2021,47(4):6-12. DOI: 10.13272/j.issn.1671-251x.2020120020

    [12] 李文华,刘娇,柴博. 节能液压泵模糊PID控制系统研究与仿真[J]. 控制工程,2017,24(7):1347-1351. DOI: 10.14107/j.cnki.kzgc.150500

    LI Wenhua,LIU Jiao,CHAI Bo. Research and simulation of energy efficient fuzzy PID control system for hydraulic pump stations[J]. Control Engineering of China,2017,24(7):1347-1351. DOI: 10.14107/j.cnki.kzgc.150500

    [13] 王建国,周燕飞. 泵控马达系统的模糊PID控制与仿真[J]. 机械设计与制造工程,2015,44(11):44-47. DOI: 10.3969/j.issn.2095-509X.2015.11.010

    WANG Jianguo,ZHOU Yanfei. Fuzzy PID control and simulation of pump - contro-motor system[J]. Mechanical Design and Manufacturing Engineering,2015,44(11):44-47. DOI: 10.3969/j.issn.2095-509X.2015.11.010

    [14] 胡相捧,刘新华,庞义辉,等. 基于BP神经网络PID的液压支架初撑力自适应控制[J]. 矿业科学学报,2020,5(6):662-671. DOI: 10.19606/j.cnki.jmst.2020.06.009

    HU Xiangpeng,LIU Xinhua,PANG Yihui,et al. Adaptive control of setting load of hydraulic support based on BP neural network PID[J]. Journal of Mining and Science,2020,5(6):662-671. DOI: 10.19606/j.cnki.jmst.2020.06.009

    [15] 李浩楠,刘勇. 模糊神经网络的优化及其应用[J]. 哈尔滨理工大学学报,2020,25(6):142-149. DOI: 10.15938/j.jhust.2020.06.021

    LI Haonan,LIU Yong. Optimization and application of fuzzy neural network[J]. Journal of Harbin University of Technology,2020,25(6):142-149. DOI: 10.15938/j.jhust.2020.06.021

  • 期刊类型引用(29)

    1. 赵勇智,吴锁,柏新茹,彭顺. 基于NSGAⅡ的车辆多目标轨迹优化研究. 黑龙江科学. 2025(04): 47-51 . 百度学术
    2. 马帅. 基于露天煤矿的智能无人驾驶技术应用与研究. 建筑机械. 2025(03): 25-29 . 百度学术
    3. 郑明芽,郑晓东,王薇薇,阙忠灏,陶海豹,彭倩. 基于探索性数据分析的电动矿卡动力电池故障影响因素研究. 煤矿机电. 2025(01): 91-95 . 百度学术
    4. 顾清华,王雪晴,王丹,张朋朋,王宇. 考虑设备突发故障的露天矿无人矿卡集群调度优化. 矿业科学学报. 2025(02): 305-315 . 百度学术
    5. 王威淳,郜普浩,白水. 露天矿山重型卡车总成件拆装机器人研究. 机械工程与自动化. 2024(01): 116-117 . 百度学术
    6. 顾清华,李佳威,陈露,祝河杰. 基于固态激光雷达的露天矿非结构化运输道路小尺寸落石检测方法. 激光与光电子学进展. 2024(08): 229-234 . 百度学术
    7. 柳昆鹏. 新疆兴盛露天矿智能化场景生态建设实践. 露天采矿技术. 2024(02): 93-97 . 百度学术
    8. 梁明智,柳昆鹏. 基于5G网络的无人驾驶运输技术在兴盛露天煤矿的应用. 露天采矿技术. 2024(03): 32-36 . 百度学术
    9. 张臻,董鹏朝,豆龙江,高义,张玉松,王奕铮. 基于小波包-1.5维Teager能量谱图和深度学习的滚动轴承故障诊断方法研究. 科技与创新. 2024(12): 10-15 . 百度学术
    10. 王忠鑫,田会,王东,田凤亮,宋波,赵明,辛凤阳,陈洪亮,王金金,苏振宁,曾祥玉. 露天采矿科学目标的演变与未来发展趋势. 煤炭学报. 2024(S1): 129-153 . 百度学术
    11. 黎一冰,韩文成,王仁福,卿启林,车长路. 露天矿山5G全连接智能采矿无线网络设计及应用. 中国矿业. 2024(S2): 127-132 . 百度学术
    12. 栾博钰,周伟,代伟,敖忠晨,陆翔. 露天矿无人卡车与有人设备安全协调作业策略. 采矿与安全工程学报. 2024(06): 1289-1298 . 百度学术
    13. 田凤亮. 基于司机行为的露天矿道路状况在线评估技术研究. 有色设备. 2024(06): 58-62+68 . 百度学术
    14. 张吉苗,宋仁忠,侯星野,佘长超,于晓波,马文平,梁皓月. 110 t氢能源矿用自卸车轴箱结构性能分析及优化. 工矿自动化. 2024(S2): 284-287 . 本站查看
    15. 佘长超,张吉苗,侯星野,卢燃,杨彦泓. 一种电动轮矿用自卸车轻量化车架设计. 工矿自动化. 2024(S2): 281-283+287 . 本站查看
    16. 文家燕,闻海潮,程洋,罗绍猛,何伟朝. 基于GWO-NSGA-Ⅱ混合算法的露天矿低碳运输调度. 工矿自动化. 2023(02): 94-101 . 本站查看
    17. 马宁,胡亚平. 无人驾驶车辆巷道十字交叉点智能决策系统研究. 矿业研究与开发. 2023(03): 179-184 . 百度学术
    18. 李标. 带式输送机多电动机驱动系统转速同步控制方法. 工矿自动化. 2023(05): 112-119 . 本站查看
    19. 徐静,李敬兆,石晴,袁浩然,赵天瑞,李小朋. 基于MA-DBNN的带式输送机健康监测系统. 机械工程与自动化. 2023(03): 4-6 . 百度学术
    20. 刘捷欣,郭心灵. 换电新能源卡车在吉郎德露天煤矿的应用. 陕西煤炭. 2023(03): 186-189 . 百度学术
    21. 于海里,孙立超,左胜,陈大伟,曾祥玉,杜垣江. 基于双激光雷达的带式输送机煤流量检测系统. 工矿自动化. 2023(07): 27-34+59 . 本站查看
    22. 武熙,李珂,孟庆灵,赵佳伟. 矿用带式输送机头部智能清扫器研究与设计. 金属矿山. 2023(08): 253-259 . 百度学术
    23. 李旭涛,刘志明,张幼振,薛建勇,张世明,张宁. 我国露天煤矿开采工艺及装备研究现状与发展趋势. 露天采矿技术. 2023(05): 6-9+13 . 百度学术
    24. 王妍,白洪亮,蒋方正,张英伟. 露天矿无人驾驶运输关键技术研究. 现代矿业. 2023(10): 178-181 . 百度学术
    25. 穆俊杰,田振华,彭倩,杨晨瀚. 基于行驶工况测试的电动矿卡电动机工作效率研究. 煤矿机电. 2023(04): 44-48 . 百度学术
    26. 路向阳,蔡建业,蓝德劭,尹超. 露天矿山运输无人驾驶作业系统研究与发展述评. 控制与信息技术. 2022(05): 1-8 . 百度学术
    27. 丁亮亮,王荣林,张东,高大林,张义杰. 白象山选厂自动化技术产线升级方案及应用研究. 现代矿业. 2022(11): 220-223+258 . 百度学术
    28. 王国法,富佳兴,孟令宇. 煤矿智能化创新团队建设与关键技术研发进展. 工矿自动化. 2022(12): 1-15 . 本站查看
    29. 周志宇,何成昭,朱文龙. 基于状态修的矿用电动轮自卸车电驱系统智能运维方案. 控制与信息技术. 2022(05): 130-136 . 百度学术

    其他类型引用(30)

图(6)  /  表(2)
计量
  • 文章访问数:  316
  • HTML全文浏览量:  55
  • PDF下载量:  51
  • 被引次数: 59
出版历程
  • 收稿日期:  2022-03-07
  • 修回日期:  2022-06-24
  • 网络出版日期:  2022-05-09
  • 刊出日期:  2022-08-08

目录

/

返回文章
返回