【论文阅读47】-微震事件的时间、空间和强度(能量)预测
论文围绕煤矿开采过程中高能矿山微震事件的时间、空间和强度(能量)预测问题,提出了一种融合深度学习与数据分解思想的分层信息预测模型 CHIM-Net。针对矿山微震数据的非平稳性、非线性和多尺度特性,作者设计了以下关键方法步骤:
-
数据分解(CEEMDAN):
将原始矿山微震监测时间序列数据分解为若干固有模式函数(IMF)和残差,缓解数据非平稳性与复杂波动性问题。 -
Hurst 指数分类:
计算各 IMF 分量的 Hurst 指数,根据其值将分量划分为“波动模式组”(随机性强,Hurst ≈ 0.5)与“稳定模式组”(趋势性强,Hurst 远离 0.5),分别送入不同预测分支。 -
双分支预测结构:
- 分支一:使用 MICN(多尺度等距卷积网络)对波动分量建模,提取局部与全局时序特征。
- 分支二:对趋势性强的分量采用简单回归模型预测。
-
结果集成:
将两个分支的预测结果拼接,得到最终的微震事件时间、空间坐标和能量预测值。 -
对比验证:
在来自内蒙古、辽宁 4 个工作面数据集上,与 Autoformer、Informer、Pyraformer、MICN、Client 等模型对比,在 MSE 和 MAE 指标上均优于其他模型,尤其在高能量微震事件预测上表现更好。 -
消融实验:
验证了 CEEMDAN 分解和双分支结构对预测性能的显著提升作用。
[1] Luo H, Zhang H, Pan Y, et al. CHIM-net: a combined hierarchical information model for predicting time, space and intensity of mining microseismic events[J]. Rock Mechanics and Rock Engineering, 2025, 58(1): 447-462.
📑 作者与单位:
- Hao Luo¹
- Huan Zhang¹
- Yishan Pan¹,² (潘一山)
- Lianpeng Dai²
- Chao Kong³
- Mingyu Bai¹
📌 作者单位:
- School of Resources and Geosciences, China University of Mining and Technology, Xuzhou, China
中国矿业大学 资源与地球科学学院,徐州,中国
📅 论文投稿与发表信息:
- 收到日期:2024年4月28日
- 接受日期:2024年9月15日
- 在线发表日期:2024年9月30日
文章目录
- 1 引言
- 2 方法
- 2.1 CEEMDAN
- 2.2 Hurst 指数
- 2.3 MICN
- 3 模型
- 3.1 数据分解
- 3.2 数据划分
- 3.3 预测模块
- 4 讨论与评估
- 4.1 实验环境与数据集
- 4.2 评估指标
- 4.3 对比实验
- 4.4 消融实验
- 5 结论
摘要
在煤矿开采过程中,高能矿山微震事件严重制约着煤矿安全生产。针对现有方法在矿山微震事件时间、空间及强度(能量)预测精度较低以及微震监测数据特征提取不足的问题,本文提出了一种融合深度学习理论与技术的联合层级信息建模方法(CHIM-Net)。该模型由数据分解模块、数据划分模块以及两个预测分支模块组成。首先对原始矿山微震监测数据进行分解与划分处理,然后将处理后的数据输入不同的预测模块进行训练,最终获得预测结果。为验证所提模型的性能,选取来自不同省份煤矿的矿山微震监测数据对模型进行训练与测试。与Autoformer、Informer等多种模型对比实验表明,CHIM-Net在矿山微震预测领域具有较高的预测精度。消融实验结果进一步验证了数据分解模块对提升预测性能的有效性。结果显示,当预测长度为48时,所提模型的均方误差平均降低18.92%,平均绝对误差降低10.57%;预测长度为96时,分别平均降低8.46%和10.23%。实验结果表明,CHIM-Net在高能矿山微震事件预测方面表现优异,为矿山微震预测与预警提供了有价值的技术参考。
亮点
- 为降低原始数据的波动性,本文采用分解方法将非平稳的矿山微震事件序列数据划分为多个不同尺度的平稳子序列。与原始序列相比,这些子序列更易预测,有助于提升预测精度。
- 当前关于矿山微震事件预测的研究较为有限,尤其是在深度学习方法应用方面,大多数现有方法仍依赖于构建数学模型或物理模型进行预测。本文基于分解与重构的方法开展矿山微震事件预测研究。
- 针对分解后的子序列特性差异,本文分析了各子信号的 Hurst 指数,并将其划分为波动分量与稳定分量,分别输入不同模型进行预测,充分利用各分量特性,从而提升预测性能。
- 本文所提出的模型不依赖特定地质条件或采矿环境,仅需矿山微震监测数据即可应用。实验结果表明,相较于其他时间序列预测模型,所提模型具有更高的预测精度。
关键词
矿山微震事件;时间序列预测;深度学习;数据分解
1 引言
煤炭资源在全球能源体系中仍占据主导地位。随着矿井开采深度和强度的不断增加,煤矿开采过程中产生的矿山微震事件的发生频率和强度空前提升(Pan et al., 2023;Wu et al., 2023)。其中,高能矿山微震事件危害极大,甚至可能诱发岩爆、瓦斯突出等灾害事故。为了减少矿山微震事件带来的人员伤亡和财产损失,亟需开展矿山微震事件预测相关研究。矿山微震监测数据本质上属于时间序列数据,可借助时间序列预测方法进行分析与预测。现有时间序列预测方法大致可分为三类:统计学模型、机器学习模型与深度学习模型,广泛应用于多个领域。
统计学模型通常适用于具有自相关性和平稳性的时间序列数据,包括自回归积分滑动平均(ARIMA)模型、向量自回归(VAR)模型等。Alabdulrazzaq 等(2021)利用最优拟合的 ARIMA 模型实现了对实际观测值的精准预测。Xu 等(2023)提出了一种基于袋装混合策略和核密度估计(KDE)的稀疏向量自回归预测方法,提升了预测精度。
随着计算性能的提升,基于机器学习的预测方法逐渐涌现,如决策树(DT)、支持向量机(SVM)等,具备处理非线性、非平稳数据的能力。Ma 等(2023)基于支持向量回归模型,构建了井筒坍塌围压预测方法,显著提升了预测精度。Ji 等(2020)将SVM与遗传算法(GA)结合,实现了岩爆风险预测。Li 等(2022)提出了一种基于深度森林(Deep Forest)模型的岩爆风险预测方法。Wang 等(2023a)采用集成学习算法,增强了岩爆预测性能。Jia 等(2024)提出基于AOA投票软集成机制的机器学习方法,实现了岩爆强度的精确分类。
近年来,深度学习技术迅速发展,涌现出众多性能优异的预测模型,具备较强的特征提取能力,优于传统机器学习方法。基于深度学习的预测方法主要包括长短期记忆网络(LSTM)、卷积神经网络(CNN)、门控循环单元(GRU)以及注意力机制等。Kang 等(2022)提出了基于双段式 LSTM 的预测模型。Emeksiz 等(2024)利用 GRU 实现了绿氢产量预测。Zhang 等(2022a)基于 Transformer 编码器,提出了融合多重注意力机制的新型注意力网络框架,实现了特征提取与分析,取得了较高预测精度。
由于时间序列数据的非线性和非平稳性,单一模型预测效果有限。为提高预测精度,基于数据分解与重构的方法逐渐兴起。通过将时间序列分解为多个子序列,分别预测各分量后再重构结果,从而实现更高精度的预测。例如,Huang 等(2022)提出了新型交通流分解建模框架,提升了短时交通流多步预测精度。Sun 等(2022)采用自适应噪声完全集合经验模态分解(CEEMDAN)方法对数据进行分解,实现了空气质量指数高精度预测。Guo 等(2022)提出的预测模型在降水预测方面取得了良好效果。Huang 等(2023)基于改进的 CEEMDAN 与极限学习机(ELM)开发了高效预测模型,提升了预测精度与效率。Zhang 等(2022b)结合 CEEMDAN、粒子群优化(PSO)和 ELM 网络,提出了两阶段组合预测模型,准确预测了太阳黑子数。
目前,关于矿山微震事件预测的研究,特别是基于深度学习方法的应用尚不充分。已有研究多聚焦于矿山微震监测方法(Zhang et al., 2021),主要包括采矿方法、地球物理方法以及多参数集成探测预警方法。Pan 等(1998)通过统计分析岩爆事件频率与能量,预测未来岩爆趋势与强度。Wang 等(2023b)基于煤巷围岩应力与变形能密度分布特征,提出了弹脆性煤巷岩爆分析预测模型。Liu 等(2023a)基于震源破裂机制及定位误差校正,构建了不同破裂类型高能事件的预测方法及指标。Qi 等(2023)总结了当前岩爆研究成果与不足,提出了煤矿岩爆源头控制的新思路。
在微震预测方面,Pei 等(2021)基于一维卷积神经网络建立了矿山微震能量等级时间序列预测模型。Liang 等(2023)利用长短期记忆神经网络(LSTM)对实验中采集的应力与声发射信号进行融合预测。Cao 等(2022)提出了融合知识与数据驱动的深度神经网络 FDNet,用于煤与瓦斯突出预测,通过历史数据预测未来高能微震事件的发生与否。Li 等(2023a)通过跟踪与校准微震事件特征,提出了基于 CNN-GRU 的微震灾害分析方法,在矿山微震监测事件灾害性分析中表现优异。Li 等(2023b)提出了 MICE-CNN 模型用于预测岩爆强度等级,Wojtecki 等(2023)采用随机森林方法预测长壁采煤过程中的振动情况。Chen 等(2022)开发了深度学习模型 MSNet,可同时预测即将发生微震事件的时间、位置和能量。然而,这些方法尚未充分挖掘微震监测数据中的隐含信息,难以实现对矿山微震事件时间、空间及强度的高精度预测。
为提升矿山微震事件预测的准确性,本文提出了联合层级信息建模方法 CHIM-Net。鉴于矿山微震数据存在显著非平稳性与非线性特征(Yang et al., 2023),预测难度较大,导致预测结果易偏离实际。为改善预测效果,本文首先采用 CEEMDAN 算法将原始微震数据分解为多个子分量。预测前,对各子序列计算 Hurst 指数,并通过多尺度分支结构对强随机性序列进行建模,即通过卷积神经网络自动挖掘时间序列中的复杂非线性特征,有效提取局部特征并捕捉全局关联。与此同时,对剩余子序列执行回归预测。最终,将各子序列预测结果集成,获得综合预测结果。CHIM-Net 可基于矿山微震监测数据,实现未来微震事件发生时间、空间位置及能量的定量预测。
2 方法
2.1 CEEMDAN
经验模态分解(EMD)是 Huang 等(1998)提出的一种用于处理非平稳信号的方法,其核心思想是将信号分解为多个尺度成分,即若干固有模态函数(IMF)及一个残差项。然而,EMD 中存在的模态混叠问题限制了后续处理效果。集合经验模态分解(EEMD)在 EMD 基础上进行了改进,通过向原始信号中加入白噪声以缓解模态混叠问题(Liu et al., 2023b;Zhao et al., 2023)。但白噪声的引入可能导致伪成分的出现。
CEEMDAN(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise)是在 EMD 和 EEMD 基础上提出的一种适用于非平稳、非线性时间序列数据的分解方法。该方法通过引入自适应白噪声,有效提取信号中的成分与趋势信息,使重构信号更贴近原始信号(Guo et al., 2023;Xu et al., 2022)。它在一定程度上缓解了 EMD 与 EEMD 中的模态混叠问题。
CEEMDAN 的基本步骤如下:
-
设原始信号为 x(t)x(t)x(t),向其加入不同幅值的高斯白噪声,得到信号:
xi(t)=x(t)+σiwi(t)x_i(t) = x(t) + \sigma_i w_i(t)xi(t)=x(t)+σiwi(t)
其中,x_i(t)x\_i(t)x_i(t) 表示加入第 iii 次噪声后的信号,σ_i\sigma\_iσ_i 为控制高斯白噪声幅值的参数。
-
对信号 x_i(t)x\_i(t)x_i(t) 进行 EMD 分解,提取第一个固有模态函数(IMF),并计算所有加入噪声后信号所得 IMF 的平均值。
-
得到第一阶 IMF 分量 IMF_1IMF\_1IMF_1 后,计算一阶残差 r_1(t)r\_1(t)r_1(t):
r1(t)=x(t)−IMF1(t)r_1(t) = x(t) - IMF_1(t)r1(t)=x(t)−IMF1(t)
-
继续对残差 r_1(t)r\_1(t)r_1(t) 进行 EMD 分解,得到第二阶 IMF 分量 IMF_2IMF\_2IMF_2,计算方式为:
IMF2(t)=平均值{Ei[r1(t)+σiwi(t)]}IMF_2(t) = \text{平均值}\left\{ E_i\left[ r_1(t) + \sigma_i w_i(t) \right] \right\}IMF2(t)=平均值{Ei[r1(t)+σiwi(t)]}
其中,E_iE\_iE_i 表示第 iii 次 EMD 分解所得成分。
-
依次类推,计算第 n+1n+1n+1 阶 IMF 分量:
IMFn+1(t)=平均值{Ei[rn(t)+σiwi(t)]}IMF_{n+1}(t) = \text{平均值}\left\{ E_i\left[ r_n(t) + \sigma_i w_i(t) \right] \right\}IMFn+1(t)=平均值{Ei[rn(t)+σiwi(t)]}
-
重复第 5 步,直至残差信号满足终止条件,无法继续分解。最终,原始信号可表示为若干固有模态函数与残差项之和:
x(t)=∑i=1NIMFi(t)+rN(t)x(t) = \sum_{i=1}^{N} IMF_i(t) + r_N(t)x(t)=∑i=1NIMFi(t)+rN(t)
2.2 Hurst 指数
为了合理选择不同模型分支预测不同的信号分量,需对各分量的特性进行判别。Hurst 指数常用于衡量时间序列数据的游走性,是分析时间序列特征的重要工具,广泛应用于随机过程、金融市场、地理数据、气象数据及信号处理等领域(Yuan et al., 2018)。Hurst 指数有助于分析时间序列的趋势性、周期性及随机性,揭示数据的重要特征。
当 Hurst 指数小于 0.5 时,表示时间序列具有负相关性,数据存在反转趋势;Hurst 指数等于 0.5 表明序列为无序随机过程,过去数据对未来无预测作用;Hurst 指数大于 0.5 时,说明序列具有自相关性,趋于保持趋势。
常用的 Hurst 指数计算方法包括重标极差分析(R/S Analysis)、广义 Hurst 指数法、R/S 分析法与去趋势波动分析(DFA)。本文采用 DFA 方法计算 Hurst 指数,具体步骤如下:
-
将长度为 NNN 的时间序列 x_t,,t=1,2,…,N{x\_t,, t=1, 2, \dots, N}x_t,,t=1,2,…,N 转换为累积序列 y(k)y(k)y(k):
y(k)=∑t=1k(xt−xˉ),k∈{1,2,…,N}y(k) = \sum_{t=1}^{k} \left( x_t - \bar{x} \right), \quad k \in \{1, 2, \dots, N\} y(k)=t=1∑k(xt−xˉ),k∈{1,2,…,N}
其中,xˉ\bar{x}xˉ 为序列均值。
-
将累积序列 y(k)y(k)y(k) 划分为 nnn 个子区间,并对每个区间拟合最小二乘直线或多项式曲线,得到拟合函数 y_n(k)y\_n(k)y_n(k),计算累积偏差 y(k)y(k)y(k) 相对拟合值的均方根波动量 F(n)F(n)F(n):
F(n)=1N∑k=1N(y(k)−yn(k))2F(n) = \sqrt{ \frac{1}{N} \sum_{k=1}^{N} \left( y(k) - y_n(k) \right)^2 } F(n)=N1k=1∑N(y(k)−yn(k))2
-
若原序列 x_t{x\_t}x_t 存在长程相关性,则满足下列关系:
F(n)∝nHF(n) \propto n^H F(n)∝nH
-
以双对数坐标绘制 logF(n)\log F(n)logF(n) 与 logn\log nlogn 的散点图,利用最小二乘法拟合直线,其斜率即为 Hurst 指数 HHH。
2.3 MICN
MICN(Multi-scale Isometric Convolutional Network)是 Wang 等(2023c)提出的一种用于时间序列预测的深度学习架构。其特点在于结合局部特征与全局特征,从时间序列中获取更加全面的信息。为充分挖掘时间序列中的潜在信息,MICN 采用多尺度分支结构对不同模式分别建模。每个模式通过卷积进行下采样,以提取时间序列中的局部特征,再利用等距卷积(Isometric Convolution)对下采样后的局部特征进行卷积,提取时间序列的全局特征。
该模型中的多尺度等距卷积(MIC)结构如图 1 所示,其计算过程如下:
-
首先对输入 X_sX\_sX_s 进行填充操作,使其在卷积处理后能还原至原始长度,然后使用卷积核大小为 iii 的一维卷积和平均池化进行下采样,得到局部特征压缩结果 Ylocal,i_sY^{\text{local}, i}\_sYlocal,i_s:
Yslocal,i=Conv1dkernel=i(AvgPool(Padding(Xs)))Y^{\text{local}, i}_s = \text{Conv1d}_{\text{kernel}=i} \left( \text{AvgPool} \left( \text{Padding}(X_s) \right) \right) Yslocal,i=Conv1dkernel=i(AvgPool(Padding(Xs)))
-
对 Ylocal,i_sY^{\text{local}, i}\_sYlocal,i_s 进行归一化(Norm)、Dropout 和 Tanh 激活,再通过等距卷积提取全局特征,得到 Y′,i_sY^{\prime, i}\_sY′,i_s:
Ys′,i=Norm(Yslocal,i)+Dropout(tanh(IsometricConv(Yslocal,i)))Y^{\prime, i}_s = \text{Norm}\left( Y^{\text{local}, i}_s \right) + \text{Dropout} \left( \tanh \left( \text{IsometricConv}\left( Y^{\text{local}, i}_s \right) \right) \right) Ys′,i=Norm(Yslocal,i)+Dropout(tanh(IsometricConv(Yslocal,i)))
-
将 Y′,i_sY^{\prime, i}\_sY′,i_s 通过一维反卷积(Conv1dTranspose)还原长度,提取全局特征,得到 Yglobal,i_sY^{\text{global}, i}\_sYglobal,i_s:
Ysglobal,i=Norm(Xs)+Dropout(tanh(Conv1dTransposekernel=i(Ys′,i)))Y^{\text{global}, i}_s = \text{Norm}(X_s) + \text{Dropout} \left( \tanh \left( \text{Conv1dTranspose}_{\text{kernel}=i} \left( Y^{\prime, i}_s \right) \right) \right) Ysglobal,i=Norm(Xs)+Dropout(tanh(Conv1dTransposekernel=i(Ys′,i)))
-
最后,将所有分支提取到的全局特征通过二维卷积与前馈神经网络(FeedForward)处理,得到最终的特征融合结果 Y_sY\_sY_s:
Ys=Norm(Conv2d(Ysglobal,i))+FeedForward(Conv2d(Ysglobal,i))Y_s = \text{Norm} \left( \text{Conv2d}\left( Y^{\text{global}, i}_s \right) \right) + \text{FeedForward} \left( \text{Conv2d}\left( Y^{\text{global}, i}_s \right) \right) Ys=Norm(Conv2d(Ysglobal,i))+FeedForward(Conv2d(Ysglobal,i))
其中,X_sX\_sX_s 表示输入序列,i∈4,8,…i \in {4, 8, \dots}i∈4,8,… 表示不同分支对应的卷积核大小。MICN 中,先通过多尺度卷积核对序列进行局部压缩,再通过等距卷积提取全局特征,最终融合不同尺度下的特征结果,提升模型的预测能力。
3 模型
基于前述方法,本文提出了 CHIM-Net,用于预测矿山微震事件的时间、空间位置及强度。模型整体结构如图 2 所示,主要包括四个部分:数据分解模块、信号划分模块、预测模块和结果融合模块。
在数据分解模块中,利用 CEEMDAN 算法对原始矿山微震监测数据的每个分量进行逐一分解,得到若干固有模态函数(IMFs)。在信号划分模块中,计算分解所得各 IMF 分量的 Hurst 指数,根据其值将各 IMF 划分为稳定模态组和波动模态组,并在归一化(采用 RevIN)后分别送入对应预测网络分支。
预测模块包含两条分支。分支一采用 MICN 结构,内含多序列分解与多尺度分支结构,分支二则包含简单序列分解与回归预测模块。最终,在数据组合模块中,将两条分支的预测结果进行拼接,得到最终预测值。
3.1 数据分解
为减小原始矿山微震数据中的非平稳性与随机波动对预测结果的影响,本文采用 CEEMDAN 算法对原始微震监测数据进行分解。本研究统一将微震监测数据分解为四个分量,并将残差项也作为其中一个分量,即 IMF_1IMF\_1IMF_1、IMF_2IMF\_2IMF_2、IMF_3IMF\_3IMF_3 和 IMF_4IMF\_4IMF_4。以 WF1208 能量数据为例,其分解结果如图 3 所示,图中蓝色部分为分解前能量数据,其余颜色则表示分解后获得的各个分量。相较于原始数据,IMF_1IMF\_1IMF_1 至 IMF_4IMF\_4IMF_4 分量的频率依次降低,数据逐渐平滑,有助于模型更好地捕捉数据中的趋势与模式,从而提升预测性能。
3.2 数据划分
完成数据分解后,计算各个分量的 Hurst 指数。WF1208 数据集的分解结果如表 1 所示。通常,Hurst 指数偏离 0.5 越远,无论偏大还是偏小,说明序列的趋势性越强。当 Hurst 指数大于 0.5 时,表明序列表现出持续性趋势,未来变化方向更容易预测;而当 Hurst 指数小于 0.5 时,表明序列存在反持续性,具有趋势反转特性,在一定程度上同样具备预测价值。
在本文中,将 Hurst 指数介于 0.4 到 0.6 之间的分量划分为波动模态组,输入至预测分支一进行预测;其余分量划分为稳定模态组,输入至预测分支二进行预测。
3.3 预测模块
在预测前,首先采用 RevIN 方法对数据进行归一化,缓解分布漂移问题,从而提升模型预测过程中的稳定性。预测结果通过以下方式拼接汇总:
y=∑i=1dConcat(ys,yf)y = \sum_{i=1}^{d} \text{Concat}(y_s, y_f) y=i=1∑dConcat(ys,yf)
其中,y_sy\_sy_s 和 y_fy\_fy_f 分别表示两条分支的预测结果,Concat(⋅)\text{Concat}(\cdot)Concat(⋅) 表示拼接操作,ddd 为分量数。
4 讨论与评估
本节对所提出模型在矿山微震事件数据集上的预测性能与其他预测模型进行对比分析。
4.1 实验环境与数据集
本实验的软件环境为 Windows 10,Python 3.9 和 Torch 1.13.1 + cu117,硬件环境包括第 11 代 Intel® Core™ i7-11700K @ 3.60GHz 处理器(128GB 内存)和 NVIDIA GTX 3080Ti 显卡。实验参数设置如下:批量大小(batch_size)为 64,训练轮次(train_epochs)为 100,优化器采用 Adam,学习率(learning rate)设为 0.001。
本实验所用矿山微震监测数据来源于内蒙古自治区某煤矿及辽宁省某煤矿工作面布设的微震监测系统,其结构示意图如图 4 所示。为验证所提出模型的适用性,选取这两处矿山工作面监测的微震数据集进行验证。具体包括辽宁某矿山的 WF802 和 WF501 数据集,以及内蒙古某矿山的 WF1208 数据集。图 5 展示了三个工作面的平面布置图。其中,内蒙古某矿 501 工作面为该采区首采工作面,煤层平均厚度 6.75m,工作面长度 300m,走向长度 3510m,煤体冲击倾向强,工作面整体评价为弱冲击危险,顶板为坚硬厚顶板,采动过程中易产生高能微震事件。
内蒙古某矿 802 工作面埋深平均 1358m,紧邻 801 全煤机采工作面采空区,可采煤层平均厚度 5.97m,整体构造形态为单斜构造,倾向西,倾角一般为 1°–7°,地质赋存条件沿走向、倾向变化不大,煤体冲击倾向强,整体评价为弱冲击危险。
辽宁某矿西二采区 1208 工作面上部为第七煤层,与第十二煤层距离约 60m,工作面中段以南为七煤层采空区,北侧为未采区,西侧为西三区 702 采空区,工作面整体构造为背斜构造,煤体冲击倾向弱,工作面总体评价为弱冲击危险。
表 2 给出了矿山微震数据集的详细信息。每个数据集包含五个属性:微震事件发生时间、地理位置的 XXX 坐标、YYY 坐标、ZZZ 坐标,以及事件能量值。为了便于处理,事件时间信息将被统一转换为时间戳格式。其余属性的统计信息如表 3 所示。
本文将数据集按 7:1:2 的比例划分为训练集、验证集和测试集,数据划分结构如图 6 所示,具体划分情况见表 4。
4.2 评估指标
为评估不同模型在矿山微震事件数据集上的预测性能,需制定合理的评估标准。本文选用均方误差(MSE) 和 平均绝对误差(MAE) 作为评价指标,这两者均为时间序列预测中常用的性能衡量指标,值越小表示预测精度越高。
其中,MAE 计算公式如下:
MAE=1N∑i=1N∣ypred(i)−ytrue(i)∣MAE = \frac{1}{N} \sum_{i=1}^{N} \left| y_{\text{pred}}(i) - y_{\text{true}}(i) \right| MAE=N1i=1∑N∣ypred(i)−ytrue(i)∣
其中,y_pred(i)y\_{\text{pred}}(i)y_pred(i) 表示测试集中第 iii 个数据点的预测值,y_true(i)y\_{\text{true}}(i)y_true(i) 表示对应的真实值,NNN 表示测试集中数据点的数量。
4.3 对比实验
为评估所提出模型在矿山微震数据集上的预测性能,本文将其与近年来时间序列预测领域常用的几种主流模型进行了对比,包括 MICN、Client(Gao 等,2023)、Autoformer(Wu 等,2021)、Informer(Zhou 等,2020)和 Pyraformer(Liu 等,2021)。在实验中,将分解后的数据输入上述模型进行预测,均方误差(MSE)和平均绝对误差(MAE)值越小表示预测性能越好,表格中用加粗标记最佳结果,下划线标记次优结果。
通过表 5 和表 6 的结果分析可以看出,所提出模型在 WF501、WF802、WF1208 和 WF402 数据集上的预测性能均优于其他对比模型。实验中,模型输入长度设定为 48,预测长度分别设置为 48 和 96,以评估模型在短期与长期预测场景下的表现。MSE 和 MAE 的计算公式如下:
MAE=1N∑i=1N∣ypred(i)−ytrue(i)∣MAE = \frac{1}{N} \sum_{i=1}^{N} \left| y_{\text{pred}}(i) - y_{\text{true}}(i) \right| MAE=N1i=1∑N∣ypred(i)−ytrue(i)∣
MSE=1N∑i=1N(ypred(i)−ytrue(i))2MSE = \frac{1}{N} \sum_{i=1}^{N} \left( y_{\text{pred}}(i) - y_{\text{true}}(i) \right)^2 MSE=N1i=1∑N(ypred(i)−ytrue(i))2
表格结果表明,无论预测长度为 48 还是 96,本文所提出模型在 MSE 和 MAE 两项指标上均具有明显优势。当预测长度为 48 时,模型的均方误差和平均绝对误差相较于其他对比模型,平均分别降低了 18.92% 和 10.57%。而在预测长度为 96 时,平均降幅分别为 8.46% 和 10.23%,充分体现了所提出模型在矿山微震事件预测中的优越性。
为更直观地对比 CHIM-Net 与其他模型的预测效果,本文以单步预测为例,选取 WF1208 数据集测试集,展示多模型预测结果与 CHIM-Net 的对比情况。如图 7、图 8、图 9、图 10 和图 11 所示,绘制了 WF1208 数据集中 2020 年 2 月 1 日至 2020 年 2 月 29 日测试集的预测结果。从对比结果可以看出,本文所提出模型在预测矿山微震事件的总体变化趋势及峰值表现方面优于其他模型。
此外,为进一步展示模型对高能量破坏性微震事件的预测效果,本文选取了 WF1208 数据集测试集中 5 个大能量矿山微震事件,对比其真实值与预测值,结果如表 7 所示。可以发现,所预测的矿山微震事件震源位置与实际震源位置较为接近,且预测发生时间均早于实际发生时间,表明模型在矿山微震灾害防控预警方面具有较好的应用意义。
值得注意的是,矿山微震事件预测属于高难度课题。Chen 等(2022)提出的 MSNet 模型已实现了矿山微震事件定量预测,并完成了煤矿爆炸危险区的定量判别,但其预测值与实际值之间仍存在较大偏差。相较而言,本文方法显著减小了预测结果在位置与能量方面的偏差,尤其是高能事件的预测精度得到了明显提升。这表明本文所提出模型能够更加有效地应对矿山微震数据的非稳定性与非线性特性,从而提升预测准确性。
4.4 消融实验
本文采用 CEEMDAN 方法对矿山微震监测数据进行分解,旨在降低数据的非平稳性,提升预测精度。为验证 CEEMDAN 分解方法的有效性,选取 WF1208 数据集作为测试对象,测试结果如图 12 所示。结果表明,2020 年 2 月 1 日至 2020 年 2 月 29 日期间,采用分解后的数据进行预测,模型的预测性能相比未分解数据有显著提升。这表明,在预测前对非平稳、非线性数据进行分解,有助于将复杂数据转化为相对平稳的分量,从而提高预测精度。
此外,为验证 CHIM-Net 模型结构中双分支结构设计对预测效果的积极作用,本文分别对模型中的分支一和分支二进行消融实验,实验结果如表 8 所示。具体而言,分别比较仅使用单一预测分支和同时使用双预测分支时模型的预测性能。
实验结果表明,当同时启用两条预测分支时,模型的预测性能优于单分支结构。这证明将数据划分为两类,并分别输入不同预测分支,有效减小了不同类型信息之间的相互干扰,能够充分发挥各分支结构的优势,进而提升整体预测效果。
实验结果进一步表明,双分支结构协同作用能够更有效地提升数据预测的准确性,验证了本文所提出 CHIM-Net 模型结构设计的合理性与有效性。
5 结论
针对当前矿山微震事件预测研究中对非平稳、非线性特性数据建模方法研究不足的问题,本文提出了 CHIM-Net 模型。利用来自不同地区多个煤矿工作面采集的微震监测数据对模型进行了验证,并通过多项评价指标证明了模型的有效性与优越性。本文所提出模型主要具有以下优势:
-
采用 CEEMDAN 算法对数据进行分解,有效平稳化、线性化原始数据,充分考虑数据复杂结构及非线性关系,为后续预测建模提供更具可控性和可解释性的数据基础。
-
基于 Hurst 指数作为评价标准对数据进行分类,针对不同类型分量采用不同预测分支,提高了时间序列数据的信息利用效率,有效提升了预测精度。
-
双分支预测结构设计,根据数据分解后的特性差异,采用差异化预测策略,充分发挥各预测分支优势,进一步优化预测效果。
本实验所采集数据主要来自地质构造简单、断层褶皱较少、受地质采动影响较小的工作面。未来研究中,拟进一步探索多源数据融合与多模型集成方法,提升模型的预测性能,扩展应用场景。此外,还需系统研究数据分解分量数量的最优设定问题,在信息保留与计算效率之间寻求平衡,从而进一步提升模型性能。
本研究相关数据集可通过以下地址获取:
https://github.com/haipingmian/datasets_chim