#Liunx内存管理# 页面分配器是按照什么方向来扫描zone的?
在 Linux 内核中,页面分配器(Page Allocator)扫描内存区域(Zone)的方向遵循 从高优先级到低优先级 的规则,具体逻辑如下:
一、Zone 的默认扫描顺序
内核根据 硬件兼容性 和 内存使用效率 预先定义了 Zone 的优先级顺序:
1.高优先级 → 低优先级
*典型顺序(以 x86_64 为例):
ZONE_NORMAL → ZONE_DMA32 → ZONE_DMA
*对于 32 位系统:
ZONE_HIGHMEM → ZONE_NORMAL → ZONE_DMA
*核心逻辑:优先从通用性高、访问速度快的 Zone 分配,避免过早耗尽特殊用途内存(如 DMA)。
2.例外场景
若分配请求通过 gfp_mask 明确指定了 Zone(如 __GFP_DMA),则直接锁定目标 Zone,跳过其他区域。
若分配标志包含__GFP_MOVABLE,优先扫描MOVABLE zone以减少内存碎片。
若对GFP_KERNEL等常规标志,按默认zonelist顺序扫描。
二、扫描方向的动态调整
分配器会根据 内存压力 和 分配策略 动态调整扫描方向:
1.首次分配尝试(Fast Path)
按默认优先级顺序(如 ZONE_NORMAL → ZONE_DMA32 → ZONE_DMA)扫描。
若某个 Zone 满足 水位线(Watermark) 条件(空闲页 ≥ min),则立即分配。
水位检测机制
通过min/low/high三级水位动态控制分配策略:
// 内核水位检查伪代码
if (zone->free_pages < zone->watermark[WMARK_MIN])
触发直接回收;
else if (zone->free_pages < zone->watermark[WMARK_LOW])
启动后台kswapd回收
2.内存不足时的回退(Fallback)
若高优先级 Zone 无法满足需求,向低优先级 Zone 降级扫描。例如:ZONE_NORMAL 不足 → 尝试 ZONE_DMA32 → 再尝试 ZONE_DMA。
此过程可能触发 内存回收 或 压缩(在慢速路径中)。
三、与 gfp_mask 的关联
1.隐式优先级覆盖
例如,GFP_KERNEL 默认允许 ZONE_NORMAL 和 ZONE_DMA32,但优先从 ZONE_NORMAL 分配。
GFP_HIGHUSER 则可能优先扫描 ZONE_HIGHMEM(在 32 位系统中)。
2.NUMA 架构影响
在多节点(NUMA)系统中,分配器优先扫描 本地节点 的 Zone,其次才是远程节点。
NUMA系统特殊处理
在NUMA架构中通过/proc/sys/vm/zone_reclaim_mode控制跨节点分配策略:
0:禁用本地回收,优先跨节点分配
1:启用本地页面回收
2:激进本地回收(含脏页回写)
四、RISC-V 架构的特殊性
在 RISC-V 平台中:
1.Zone 简化
通常仅保留 ZONE_NORMAL 和 ZONE_DMA,无 ZONE_HIGHMEM(因 64 位地址空间充足)。
2.扫描顺序
默认从 ZONE_NORMAL 开始,若 DMA 请求则直接跳至 ZONE_DMA。
五、示例场景
场景 1:用户进程申请普通内存(GFP_KERNEL)
→ 分配器按 ZONE_NORMAL → ZONE_DMA32 → ZONE_DMA 顺序扫描。
若仍不满足,转向相邻节点重复上述顺序
最终触发直接内存回收或OOM
场景 2:DMA 设备申请内存(__GFP_DMA)
→ 直接锁定 ZONE_DMA,跳过其他 Zone。
六、源码实现
在内核代码中,Zone的扫描顺序通过for_each_zone_zonelist_nodemask宏实现,核心逻辑为:
// mm/page_alloc.c
struct page *alloc_pages(gfp_t gfp_mask, unsigned int order) {
// 根据gfp_mask确定允许的最高Zone类型(如ZONE_NORMAL)
enum zone_type highest_zoneidx = gfp_zone(gfp_mask);
// 按优先级从高到低遍历Zone
for_each_zone_zonelist_nodemask(zone, z, zonelist, highest_zoneidx, nodemask) {
if (zone_watermark_ok(zone, order, ...)) {
// 分配成功
return page;
}
}
// 所有Zone均无法满足请求
return NULL;
}
5.10内核:
static struct page *get_page_from_freelist(gfp_t gfp_mask, unsigned int order, int alloc_flags,
const struct alloc_context *ac)
{
no_fallback = alloc_flags & ALLOC_NOFRAGMENT;
z = ac->preferred_zoneref;
for_next_zone_zonelist_nodemask(zone, z, ac->highest_zoneidx,ac->nodemask)
}
七、优势与设计考量
性能优化:优先使用ZONE_NORMAL减少地址转换开销。
资源隔离:保留DMA Zone内存供硬件设备使用,避免竞争。
减少碎片:按优先级分配可延缓低Zone的碎片化。
总结:页面分配器的 Zone 扫描方向本质是 优先级驱动,结合硬件约束(如 DMA 需求)、内存状态(水位线)和分配策略(gfp_mask)动态决策。这种设计平衡了性能(减少跨 Zone 访问开销)和可靠性(避免特殊内存耗尽)。