2025华为杯A题B题C题D题E题F题选题建议思路数学建模研研究生数学建模思路代码文章成品
完整内容请看文末的名片获取哦
队伍背景 推荐选题 理由
计算机/电子/自动化 A题 或 E题 算法实现强,硬件或信号处理背景
通信/信号处理 B题 或 E题 熟悉信道建模或振动信号分析
地质/图像处理 C题 图像识别与三维重建能力强
气象/GIS/控制 D题 多源数据融合与路径规划经验
建筑/设计 F题 美学建模与空间分析兴趣强
硬核算法与性能极致:选 A题。这是最接近计算机科学核心的题目。
学科背景(通信、地质、气象、机械):对应选择 B、C、D、E 题。领域知识将是最大优势。
F题。最开放,最能体现数学建模连接文理的魅力。
强调数据驱动与深度学习:B、C、E 题是首选,其次是D和F。
强调优化理论与运筹学:A、D 题是首选。
A题:通用神经网络处理器下的核内调度问题
关键词:NPU、SIMD、DAG调度、缓存管理、优化算法
适合人群:计算机、电子工程、自动化、运筹优化背景的队伍
难点:
需要理解硬件架构(如华为Davinci NPU)
调度算法设计(拓扑排序 + 缓存分配 + SPILL操作)
多目标优化:最小化执行时间 + 最小化数据搬运量
优势:
问题定义清晰,有明确的评估指标
附录详细,数据结构明确(JSON/CSV)
适合算法能力强、喜欢编程实现的队伍
核心挑战与模型深度:
此题的复杂性远非简单的拓扑排序或背包问题。它本质上是带资源约束的DAG调度(Resource-Constrained Project Scheduling Problem, RCPSP) 与动态内存分配(Dynamic Memory Allocation) 的强耦合优化问题,且两者相互影响、互为约束。
双重依赖关系:
显式依赖(数据流):由计算图固有的边决定,是硬约束。
隐式依赖(资源流):由缓存地址复用引入。若缓冲区B复用了缓冲区A的地址空间,则B的ALLOC必须在A的FREE之后,这相当于在图中添加了一条新的依赖边。调度算法必须能动态识别并满足这些隐式依赖,否则会导致数据覆盖错误。
多目标权衡的帕累托前沿:
目标一(问题1):最小化峰值内存驻留量(max(V_stay))。这类似于寻找一个能使内存使用“平缓”的调度序列,减少内存需求的“波峰”。这可以转化为图论中的线性排列问题(Minimum Profile Ordering) 或使用启发式算法(如:基于深度、基于关键路径的排序)。
目标二(问题2&3):在给定缓存容量下,最小化SPILL操作带来的额外数据搬运量。这类似于一个复杂的二维装箱问题(2D Bin Packing),但箱子的“长度”(地址空间)是固定的,“宽度”(缓冲区的生命周期)是由调度序列动态决定的。一个优秀的调度(短生命周期)能为内存分配创造更优的条件。
目标三(问题3):最小化总执行时间。这需要最大化不同硬件单元(Cube, Vector, MTE等)之间的流水线并行度。这需要算法能识别计算图中的并行子图,并巧妙地交错编排不同单元的指令,以掩盖内存访问延迟。
高级建模思路:
单纯的贪心或启发式算法可能难以达到最优。需要更复杂的组合优化策略:
联合优化框架:将调度与分配联合建模为一个大规模的混合整数线性规划(MILP) 问题。虽然计算成本高,但对于小规模图或作为理论基准非常有效。
元启发式算法:采用遗传算法(GA) 或模拟退火(SA),将调度序列编码为染色体,以执行时间或总搬运量为适应度函数,进行全局搜索。
机器学习引导的搜索:训练一个图神经网络(GNN) 来预测节点的“优先级”,指导调度顺序的选择,或预测哪些缓冲区更适合被换出(SPILL)。
适合队伍:具有强算法设计能力、编译原理/体系结构背景、熟悉组合优化和调度理论的队伍。这是一个非常“计算机科学”的硬核题目。
B题:无线通信系统链路速率建模
关键词:MIMO-OFDM、SINR、EESM模型、信道估计、迁移学习
适合人群:通信工程、电子信息、信号处理、数学建模背景的队伍
难点:
需要理解无线通信物理层抽象(SINR、香农容量)
模型拟合与验证(EESM参数拟合、新模型设计)
数据维度高(2×4×122信道矩阵)
优势:
数据完备,有训练集和验证集
可结合机器学习/深度学习进行建模
适合有通信或信号处理背景的队伍
核心挑战与模型深度:
此题的关键在于理解并超越传统的有效信噪比映射(ESM) 模型。EESM只是其中一种方法,其假设所有子载波相互独立,且使用指数函数进行压缩,这在复杂的MIMO信道和实际编码调制方案下可能不够精确。
从物理层到链接层的“语义鸿沟”:
香农公式给出的是理论极限,实际系统的编码(如LDPC)、调制(如1024-QAM)、MIMO接收机算法(MMSE, SIC)都会导致实际吞吐量与理论容量存在一个信噪比缺口(SNR gap)。你的模型本质上是在学习这个“缺口”函数。
高维信道矩阵的特征提取:
直接使用122个子载波的SINR进行加权平均会丢失大量结构信息。更高级的做法是对信道矩阵 Hi\mathbf{H}_iHi 进行深度特征提取:
奇异值分解(SVD):提取信道矩阵的有效秩(Effective Rank) 和条件数(Condition Number),这些特征反映了信道的空间复用能力和稳定性。
协方差矩阵特征值:计算信道协方差矩阵的特征值分布,其分散程度与信道质量密切相关。
可以将每个样本视为一个 2x4x122 的三维张量,使用卷积神经网络(CNN) 或Transformer 来自动学习空间-频率联合特征。
构建端到端的可微分模型:
一个更复杂的思路是构建一个可微分通信仿真器。模型输入原始信道矩阵,内部包含一个可微分的SINR计算模块、一个可学习的ESM映射函数(例如用神经网络 Φθ(x)\Phi_{\theta}(x)Φθ(x) 替代 1−exp(−x)1-exp(-x)1−exp(−x)),最后输出预测的速率。通过梯度下降,可以同时优化特征提取器和映射函数。
高级建模思路:
特征工程 + 轻量级模型:精心设计物理层特征(如各子载波SINR、信道矩阵特征值、相关矩阵等),然后使用梯度提升树(XGBoost/LightGBM) 或 SVR 进行回归。这是稳健且可解释性强的方法。
深度学习端到端模型:使用 1D-CNN 处理每个天线的子载维,然后用 2D-CNN 或 Transformer 处理空间维,最后接全连接层输出速率。这是性能潜力最高的方法。
混合专家模型(MoE):为不同的信道类型(如高秩、低秩、高相关、低相关)训练不同的专家模型,再用一个门控网络根据信道特征选择专家,以适应不同的信道条件。
适合队伍:具有通信物理层背景、信号处理经验、或深度学习能力,并对跨领域建模有浓厚兴趣的队伍。
C题:围岩裂隙精准识别与三维模型重构
关键词:图像识别、裂隙聚类、JRC粗糙度、三维重构、钻孔数据
适合人群:地质工程、计算机视觉、图像处理、数学建模背景的队伍
难点:
图像预处理与干扰去除(泥浆、纹理、拼接线)
裂隙建模(正弦曲线拟合、JRC计算)
多钻孔数据融合与三维重建
优势:
问题具有工程应用价值
可结合CNN、聚类算法、几何建模等方法
适合有图像处理或地质背景的队伍
核心挑战与模型深度:
此题是一个典型的从感知到重建的管道(Pipeline),每个环节都充满挑战。
像素级语义分割的挑战:
裂隙与背景(纹理、泥浆、划痕)的区分是小目标、弱边缘、高噪声下的分割问题。普通的CNN可能表现不佳。
高级模型:需要使用U-Net++、DeepLabv3+ 等带有跳跃连接和空洞卷积的先进分割网络。注意力机制(Attention) 和边界感知损失函数(Boundary-aware Loss) 可以显著提升裂隙边缘的分割精度。
数据瓶颈:标注数据稀缺。可采用自监督预训练(如在大量无标注钻孔图像上做对比学习)或生成对抗网络(GAN) 进行数据增强。
从2D到3G的几何推理:
“正弦状”裂隙拟合:这不仅是简单的正弦曲线拟合(y=Rsin(2πxP+β)+Cy = R\sin(\frac{2\pi x}{P} + \beta) + Cy=Rsin(P2πx+β)+C)。更是一个实例分割和聚类问题。需要先将属于同一条裂隙的像素点聚类,再用RANSAC或最小二乘法进行鲁棒拟合。参数 (R,P,β,C)(R, P, \beta, C)(R,P,β,C) 直接对应了裂隙面在三维空间中的倾角和走向。
JRC计算与三维重建:JRC的计算高度依赖于轮廓线坐标点的采样密度和精度。简单的等间距采样会丢失细节。应采用基于弦高的自适应采样方法,在曲率大的地方采集更密的点。三维重建是多视图几何的经典问题,需要将多个钻孔中推断出的裂隙面(每个面由法向量和中心点定义)在空间中进行融合与插值,构建出连续的三维裂隙网络模型。
高级建模思路:
多任务学习:设计一个网络同时输出像素级分割结果、裂隙实例标签、以及裂隙参数(R, P, β, C)的初始估计。
图神经网络(GNN)用于连通性分析:将每个钻孔中识别出的裂隙面视为图中的节点,节点之间的边代表连通的可能性(基于空间距离、法向量相似性、JRC相似性)。然后利用GNN进行节点分类(是否连通)。
适合队伍:具有计算机视觉、摄影测量、地质工程背景,熟悉深度学习框架和几何算法的队伍。
D题:低空湍流监测及最优航路规划
关键词:湍流建模、风廓线雷达、多源数据融合、路径规划、气象学
适合人群:大气科学、地理信息、控制科学、数学建模背景的队伍
难点:
多源异构数据融合(雷达、气象站、微波辐射计)
湍流强度建模(TKE、Richardson数、涡旋耗散率)
时空外推与路径规划(动态优化)
优势:
问题前沿,贴合低空经济国家战略
可结合数值模拟、机器学习、优化算法
适合有气象或GIS背景的队伍
核心挑战与模型深度:
此题是典型的数据同化(Data Assimilation) 和时空预测问题,要求将多源、异构、不同分辨率的观测数据融合成一个高分辨率的四维(3D空间+时间)湍流场。
多源数据融合的复杂性:
不同设备的观测值(风廓线雷达的径向风、微波辐射计的温度、天气雷达的谱宽)是不同物理量,且存在于不同的坐标系(高度维、锥面、点)中。融合它们需要一个统一的物理框架。
高级方法:采用变分同化(Variational Assimilation) 或卡尔曼滤波(Kalman Filter) 的思想,将所有观测数据作为约束,去优化一个背景场(如数值预报的初始场),从而得到最可能的三维湍流场。这需要定义复杂的代价函数。
湍流指标的物理建模与数据驱动建模:
模型a:基于物理公式(如Richardson数、TKE方程),需要温度、风、湿度的垂直廓线。
模型b/c:仅用风廓线雷达数据。这是一个数据驱动的建模过程。可以将风廓线数据(风速、谱宽)随时间、高度的变化视为一个图像,使用 CNN 或 ConvLSTM 来学习其与湍流强度(由模型a标注)的映射关系。
时空预测与外推:
问题3 要求进行预报。这属于时空序列预测问题。可以将数值预报数据或观测数据在时空维度上切块,使用 3D CNN、Transformer 或 PredRNN 等高级模型来预测未来时次的湍流场。
风险感知的路径规划:
最优航路规划不是在静态场上找最短路径,而是在一个动态的风险场中找一条累积暴露风险最低的路径。这需要定义“风险”(如与湍流强度、持续时间相关),并求解动态规划或A*算法的变种。
适合队伍:具有大气科学、遥感、气象学背景,或强时空数据建模与分析能力(熟悉CNN, RNN, GNN)的队伍。难度极高,但成果会非常出彩。
E题:高速列车轴承智能故障诊断问题
关键词:故障诊断、迁移学习、振动信号分析、可解释AI
适合人群:机械工程、信号处理、机器学习、自动化背景的队伍
难点:
振动信号特征提取(时域、频域、时频域)
迁移学习设计(源域→目标域)
模型可解释性分析(事前/中/后)
优势:
数据丰富(161个源域 + 16个目标域样本)
可结合深度学习、信号处理、迁移学习框架(如DANN、ADDA)
适合有机械故障诊断或AI背景的队伍
核心挑战与模型深度:
此题是迁移学习在工业领域的典型应用,核心是解决分布偏移(Distribution Shift) 问题。
深度特征提取与表征学习:
简单的时域、频域特征(均值、方差、频谱峰值)在跨域场景下可能失效。需要学习域不变特征(Domain-Invariant Features)。
高级方法:使用 1D-CNN 或 Transformer 直接从原始振动信号中提取深层特征。更先进的是使用小波散射网络(Wavelet Scattering Network),它能提供具有平移不变性和稳定性的特征,非常适合振动信号。
迁移学习的核心架构:
基于差异的迁移:在神经网络的基础上,添加一个领域判别器,并与特征提取器进行对抗训练(如DANN, ADDA),迫使特征提取器学习到源域和目标域无法区分的特征。
基于重构的迁移:使用自编码器(Autoencoder) 或 VAE 先在源域上学习信号的重构,然后在目标域上进行微调,其编码器提取的特征往往具有更好的泛化性。
可解释性(XAI):
事后解释:使用 SHAP 或 LIME 分析模型决策依据,查看是哪些时间点或频率点对分类贡献最大。
机理对齐:将模型关注的重点(通过梯度加权类激活图(Grad-CAM) 生成时频谱上的热力图)与根据故障特征频率计算出的理论故障频率进行对比,验证模型是否真的学到了物理规律。这是最高级的可解释性分析。
适合队伍:具有机械故障诊断背景、迁移学习/深度学习经验,并对可解释AI有深刻理解的队伍。是一个理论与实践结合非常紧密的题目。
F题:江南古典园林的美学特征建模
关键词:空间分析、路径规划、美学量化、相似度计算、多模态数据
适合人群:建筑学、景观设计、计算机图形学、数学建模背景的队伍
难点:
美学特征量化(“趣味性”“幻境感”“相似度”)
多模态数据融合(平面图、矢量图、坐标、照片)
主观概念数学化(如“开合变化”“移步异景”)
优势:
文化性强,具有创新性和跨学科性
可结合图论、空间句法、计算机视觉等方法
适合有建筑、设计或人文计算背景的队伍
核心挑战与模型深度:
此题最大的挑战在于将主观、定性、人文的美学概念转化为客观、定量、计算的数学模型。
“趣味性”建模 - 图论与空间句法:
将园林平面图转化为图(Graph):节点是路径交叉点或景观观赏点,边是路径。
量化指标:
整合度(Integration) 和 可理解度(Intelligibility)(来自空间句法):衡量空间的可达性与可导航性,数值高低可对应“迷宫性”的强弱。
角度变化率:计算路径方向变化的剧烈程度,量化“蜿蜒曲折”。
视线熵(View Entropy):沿着路径移动,计算从每个点可见的景观元素的香农熵,熵值变化大则“移步异景”效果好。
“幻境感”建模 - 景观生态学与计算机视觉:
元素分布:借鉴景观生态学的斑块-廊道-基质模型,计算各类景观元素的斑块密度(PD)、边缘密度(ED)、分形维数(FRAC) 等指标,量化空间的破碎度与复杂性。
开合变化:定义“开阔度”指数。例如,计算从某个点出发的视野开阔面积(通过视线分析),或计算该点周围一定半径内建筑/山体等实体的遮挡率。整条路径上开阔度的标准差或动态范围可以量化“开合变化”。
主题识别:使用无监督聚类(如GMM, DBSCAN)对园林区域进行划分,每个区域的特征由其中包含的景观元素类型比例、平均开阔度等构成。
“相似度”建模 - 图嵌入与集合相似度:
将每个园林表示为一个特征向量,包含上述所有量化指标(路径指标、空间句法指标、景观格局指标等)。
计算园林间的余弦相似度或欧氏距离。
更高级的方法是將园林的平面图通过图神经网络(GNN) 学习到一个图嵌入(Graph Embedding) 向量,再计算向量间的相似度,这种方法能更好地捕捉拓扑结构的相似性。
适合队伍:具有建筑学/景观设计理论背景、空间分析能力、计算机视觉/图算法编程能力的跨学科队伍。极具创新潜力。