2025华为杯研究生数学建模竞赛B题及求解思路
2025年研究生数学建模竞赛B题(无线通信系统链路速率建模)解决思路
一、问题背景梳理
无线通信系统中,MIMO-OFDM技术(多输入多输出+正交频分复用)是提升链路速率的核心技术,结合TxBF(发送波束赋形) 可进一步通过电磁波相干增强提升速率。题目需基于实际采集的信道数据(CSI矩阵)和速率标签(MCS),解决三类速率建模问题:
- 基于经典EESM模型(指数等效信干噪比映射)的参数拟合与速率估计(关闭TxBF);
- 提出关闭TxBF场景下的新速率估计模型;
- 提出开启TxBF场景下的新速率估计模型。
核心数据基础:
- 信道状态信息(CSI):2×4×122复数矩阵(2根接收天线、4根发送天线、122个载波单元);
- 标签:传输速率索引(MCS);
- 辅助信息:底噪(noise_floor,单位dBm,需转换为线性功率)、波束赋形开启指示(beamforming_en)。
二、需要解决的问题明确
问题1:EESM模型参数拟合与B集速率估计(关闭TxBF)
- 输入:数据集A(CSI+MCS标签,关闭TxBF)、数据集B(仅CSI,关闭TxBF)、noise_floor;
- 核心任务:
- 计算每个载波单元的SINR(信干噪比);
- 拟合EESM模型的参数(α、β,推广形式);
- 用拟合后的EESM模型将多载波SINR映射为等效SINR,再估计B集的MCS。
问题2:关闭TxBF的新速率估计模型
- 输入:数据集A(CSI+MCS标签,关闭TxBF)、数据集B(仅CSI,关闭TxBF);
- 核心任务:跳出EESM的“等效SINR降维”框架,通过多特征融合(如CSI统计特征、天线相关性)设计模型,实现更高精度的MCS估计。
问题3:开启TxBF的新速率估计模型
- 输入:数据集A(CSI+MCS_TxBF标签,开启TxBF)、数据集B(仅CSI,开启TxBF);
- 核心任务:先对CSI做TxBF处理(SVD分解获取波束赋形矩阵V_i),再设计融合TxBF增益特征的模型,估计B集的MCS_TxBF。
三、问题建模
3.1 基础共性建模(三类问题通用)
1. CSI矩阵重构
每个样本的CSI存储于8列(r0c0~r1c3),每列含122个载波的复数(实部+虚部),重构第i个载波的信道矩阵:
Hi(n,m)=Re(csirn,cm[i])+j⋅Im(csirn,cm[i])H_i(n,m) = \text{Re}(csi_{rn,cm}[i]) + j\cdot\text{Im}(csi_{rn,cm}[i])Hi(n,m)=Re(csirn,cm[i])+j⋅Im(csirn,cm[i])
其中:n=0,1n=0,1n=0,1(接收天线),m=0,1,2,3m=0,1,2,3m=0,1,2,3(发送天线),i=0,…,121i=0,\dots,121i=0,…,121(载波)。
2. 底噪单位转换
noise_floor为dBm(相对于1mW的分贝数),转换为线性功率(mW):
Pnoise=10noise_floor/10P_{\text{noise}} = 10^{\text{noise\_floor}/10}Pnoise=10noise_floor/10
3. MCS标签处理
MCS为离散速率索引(如Wi-Fi 6的MCS 0~31),视为分类任务标签(或回归后取整),需过滤异常值(3σ法或IQR法)。
3.2 问题1:EESM模型建模
1. 载波级SINR计算(关闭TxBF)
根据题目表2,关闭TxBF时MIMO-OFDM的SINR为信道矩阵Frobenius范数平方与噪声功率的比值:
γi=∥Hi∥F2Pnoise\gamma_i = \frac{\|H_i\|_F^2}{P_{\text{noise}}}γi=Pnoise∥Hi∥F2
其中∥Hi∥F2=∑n=01∑m=03∣Hi(n,m)∣2\|H_i\|_F^2 = \sum_{n=0}^1\sum_{m=0}^3 |H_i(n,m)|^2∥Hi∥F2=∑n=01∑m=03∣Hi(n,m)∣2(Frobenius范数平方,即所有元素模的平方和)。
2. EESM等效SINR模型(含参数α、β)
题目中EESM推广形式为:
γeff=α⋅Φ−1(1122∑i=0121Φ(γiβ))\gamma_{\text{eff}} = \alpha \cdot \Phi^{-1}\left( \frac{1}{122}\sum_{i=0}^{121} \Phi\left( \frac{\gamma_i}{\beta} \right) \right)γeff=α⋅Φ−1(1221i=0∑121Φ(βγi))
当Φ(x)=1−exp(−x)\Phi(x) = 1-\exp(-x)Φ(x)=1−exp(−x)时(指数型ESM),Φ−1(z)=−ln(1−z)\Phi^{-1}(z) = -\ln(1-z)Φ−1(z)=−ln(1−z),代入得:
γeff(α,β)=α⋅(−ln(1−1122∑i=0121(1−exp(−γiβ))))\gamma_{\text{eff}}(\alpha,\beta) = \alpha \cdot \left( -\ln\left( 1 - \frac{1}{122}\sum_{i=0}^{121} \left( 1-\exp\left( -\frac{\gamma_i}{\beta} \right) \right) \right) \right)γeff(α,β)=α⋅(−ln(1−1221i=0∑121(1−exp(−βγi))))
简化后(整理对数项):
γeff(α,β)=α⋅(−ln(1122∑i=0121exp(−γiβ)))\gamma_{\text{eff}}(\alpha,\beta) = \alpha \cdot \left( -\ln\left( \frac{1}{122}\sum_{i=0}^{121} \exp\left( -\frac{\gamma_i}{\beta} \right) \right) \right)γeff(α,β)=α⋅(−ln(1221i=0∑121exp(−βγi)))
其中α\alphaα(增益参数)、β\betaβ(缩放参数)为待拟合参数。
3. EESM→MCS映射模型
以γeff(α,β)\gamma_{\text{eff}}(\alpha,\beta)γeff(α,β)为输入特征,MCS为标签,建立分类模型(如逻辑回归、LightGBM),拟合目标为最小化预测MCS与真实MCS的误差(如分类交叉熵、MAE)。
3.3 问题2:关闭TxBF的新模型建模(多特征融合)
1. 特征工程(核心区别于EESM)
设计三类物理意义明确的特征,覆盖载波级、全局统计、相关性维度:
特征类别 | 具体特征(示例) | 维度(示例) |
---|---|---|
载波级CSI特征 | 1. ∣Hi∣F2|H_i|_F^2∣Hi∣F2(SINR分子);2. rank(Hi)rank(H_i)rank(Hi)(信道秩,1或2);3. 奇异值σ1,σ2\sigma_1,\sigma_2σ1,σ2 | 122×3122 \times 3122×3 |
全局统计特征 | 1. γi\gamma_iγi的均值/方差/最大值/中位数;2. 奇异值σ1\sigma_1σ1的均值/方差;3. 秩为1的载波占比 | 10维 |
相关性特征 | 1. 相邻载波γi\gamma_iγi的皮尔逊相关系数;2. 发送天线间信道系数相关性(平均) | 5维 |
2. 模型结构
选择LightGBM分类器(数模竞赛最优选择之一):
- 优势:自动捕捉特征交互、抗过拟合、训练速度快;
- 输入:上述特征(维度约122×3+10+5=381122×3+10+5=381122×3+10+5=381,可选PCA降维至100维内);
- 输出:MCS标签;
- 损失函数:多分类交叉熵。
3.4 问题3:开启TxBF的新模型建模(融合TxBF增益)
1. TxBF处理与载波级SINR计算
对每个载波的HiH_iHi做SVD分解(Hi=UiDiViHH_i = U_i D_i V_i^HHi=UiDiViH,UiU_iUi为2×2酉矩阵,DiD_iDi为2×4奇异值对角矩阵,ViV_iVi为4×4波束赋形矩阵):
- TxBF后信道矩阵:Hi,TxBF=HiVi=UiDiH_{i,\text{TxBF}} = H_i V_i = U_i D_iHi,TxBF=HiVi=UiDi(因ViHVi=IV_i^H V_i = IViHVi=I);
- 开启TxBF的SINR:γi,TxBF=∥Hi,TxBF∥F2Pnoise=σ12+σ22Pnoise\gamma_{i,\text{TxBF}} = \frac{\|H_{i,\text{TxBF}}\|_F^2}{P_{\text{noise}}} = \frac{\sigma_1^2 + \sigma_2^2}{P_{\text{noise}}}γi,TxBF=Pnoise∥Hi,TxBF∥F2=Pnoiseσ12+σ22(σ1,σ2\sigma_1,\sigma_2σ1,σ2为DiD_iDi的奇异值)。
2. TxBF专属特征工程
在问题2特征基础上,增加TxBF增益相关特征:
特征类别 | 具体特征(示例) | 维度(示例) |
---|---|---|
TxBF载波级特征 | 1. ∣Hi,TxBF∣F2|H_{i,\text{TxBF}}|_F^2∣Hi,TxBF∣F2;2. 奇异值占比σ12/(σ12+σ22)\sigma_1^2/(\sigma_1^2+\sigma_2^2)σ12/(σ12+σ22) | 122×2122 \times 2122×2 |
TxBF全局特征 | 1. γi,TxBF\gamma_{i,\text{TxBF}}γi,TxBF的统计量;2. 全局TxBF增益μ(γi,TxBF)/μ(γi)\mu(\gamma_{i,\text{TxBF}})/\mu(\gamma_i)μ(γi,TxBF)/μ(γi) | 8维 |
波束赋形特征 | 1. ViV_iVi列向量正交性误差(∣ViHVi−I∣F|V_i^H V_i - I|_F∣ViHVi−I∣F);2. 奇异值比σ1/σ2\sigma_1/\sigma_2σ1/σ2的均值 | 3维 |
3. 模型结构
同问题2(LightGBM分类器),输入替换为TxBF专属特征,输出为MCSTxBFMCS_{\text{TxBF}}MCSTxBF标签。
四、求解方法框架
4.1 通用数据预处理(三类问题均需)
- 数据加载与对齐:按终端MAC地址分组,对齐CSI采集时间(csi_time)与速率采集时间(dfx_time),仅保留时间差<10ms的样本(确保CSI与MCS对应);
- CSI重构与噪声转换:按3.1节重构HiH_iHi,转换PnoiseP_{\text{noise}}Pnoise;
- 异常值过滤:删除MCS超出合理范围(如0~31)或CSI范数为0的样本;
- 数据划分:数据集A按8:2分为训练集(Train)和验证集(Val),用于模型调优。
4.2 问题1:EESM模型求解步骤
步骤1:计算数据集A的载波级SINR
对A中每个样本,遍历122个载波,按3.2.1节计算γi\gamma_iγi。
步骤2:拟合EESM参数α、β
- 网格搜索范围:α∈[0.1,2.0]\alpha \in [0.1,2.0]α∈[0.1,2.0](步长0.1),β∈[0.1,2.0]\beta \in [0.1,2.0]β∈[0.1,2.0](步长0.1);
- 对每个(α,β)(\alpha,\beta)(α,β):
- 计算样本的γeff(α,β)\gamma_{\text{eff}}(\alpha,\beta)γeff(α,β);
- 训练LightGBM模型(输入γeff\gamma_{\text{eff}}γeff,输出MCS);
- 用Val集计算准确率,选择准确率最高的(α,β)(\alpha,\beta)(α,β)。
步骤3:数据集B的速率估计
- 计算B中每个样本的γi\gamma_iγi;
- 用最优(α,β)(\alpha,\beta)(α,β)计算γeff\gamma_{\text{eff}}γeff;
- 用拟合好的LightGBM模型预测MCS,输出速率索引。
4.3 问题2:关闭TxBF新模型求解步骤
步骤1:特征提取
对A的Train/Val集、B集,按3.3.1节提取多维度特征,确保特征维度一致。
步骤2:模型训练与调优
- 超参数调优(网格搜索):
- 学习率:[0.01,0.1,0.2][0.01,0.1,0.2][0.01,0.1,0.2];
- 树深度:[3,5,7][3,5,7][3,5,7];
- 迭代次数:[100,200,300][100,200,300][100,200,300];
- 5折交叉验证:计算平均准确率、F1宏平均,选择最优超参数。
步骤3:B集速率估计
用训练好的模型对B集特征预测MCS,输出结果。
4.4 问题3:开启TxBF新模型求解步骤
步骤1:TxBF处理与特征提取
对A的Train/Val集、B集,按3.4.1节做SVD分解与γi,TxBF\gamma_{i,\text{TxBF}}γi,TxBF计算,再按3.4.2节提取TxBF专属特征。
步骤2:模型训练与B集预测
同问题2的步骤2~3,仅输入特征替换为TxBF特征,输出MCSTxBFMCS_{\text{TxBF}}MCSTxBF。
4.5 结果验证与输出
- 模型性能指标:准确率(分类)、MAE(回归)、F1-score(不平衡标签);
- 结果输出:按题目要求将B集的MCS估计结果整理为表格,标注模型名称(如“LightGBM-TxBF”)与关键参数。
关键注意事项
- SVD数值稳定性:使用
numpy.linalg.svd
(指定full_matrices=False
),避免复数矩阵分解的数值误差; - 特征物理意义:避免无意义特征(如随机生成的特征),确保特征与速率的关联性(如奇异值直接反映信道增益);
- 过拟合控制:通过LightGBM的
reg_alpha
(L1正则)、reg_lambda
(L2正则)和早停(early stopping)防止过拟合。