当前位置: 首页 > news >正文

Linux内核内存管理单元 详解Linux 内核伙伴系统(Buddy System)的快速路径分配函数get_page_from_freelist

一、函数核心作用

get_page_from_freelist 是 Linux 内核伙伴系统(Buddy System)的快速路径分配函数,负责从指定的内存区域(Zone)中高效分配连续的物理内存页。其核心逻辑是遍历允许的 Zone 列表,检查水位线和分配条件,并调用 rmqueue 从伙伴系统的空闲链表中获取内存块。

 

二、关键执行流程

 

1. 遍历Zone列表

for_next_zone_zonelist_nodemask(zone, z, ac->highest_zoneidx, ac->nodemask)

Zone优先级:按 ac->preferred_zoneref 顺序遍历允许的 Zone(如 ZONE_NORMAL → ZONE_DMA32)。

 

NUMA节点限制:通过 ac->nodemask 过滤非允许的 NUMA 节点。

 

2. 分配条件检查

 

CPUSET约束(cpusets_enabled()):若 Zone 不在当前进程允许的 CPU 集合内,跳过该 Zone。

 

脏页限制(ac->spread_dirty_pages):

 

若 Zone 所在节点的脏页超过阈值(node_dirty_ok 失败),跳过以避免单节点脏页堆积。

碎片避免策略(no_fallback):

 

若启用 ALLOC_NOFRAGMENT,优先从本地 NUMA 节点分配,若需跨节点则允许碎片化(alloc_flags &= ~ALLOC_NOFRAGMENT)。

 

3. 水位线检查

mark = wmark_pages(zone, alloc_flags & ALLOC_WMARK_MASK);

if (!zone_watermark_fast(zone, order, mark, ...))

水位线类型:根据 alloc_flags 选择低/中/高水位线(例如 ALLOC_WMARK_LOW)。

 

快速水位检查:zone_watermark_fast 快速判断 Zone 的空闲页是否足够:

 

若不足,可能触发异步回收(node_reclaim)或延迟页初始化(_deferred_grow_zone)。

 

4. 分配内存页

page = rmqueue(..., order, gfp_mask, ...);

if (page) {

    prep_new_page(page, order, ...);

    return page;

}

调用 rmqueue:从指定 Zone 的伙伴系统空闲链表中提取连续内存块。

 

页面预处理(prep_new_page):

 

初始化页标志(PG_uptodate、PG_active 等)。

 

若启用 __GFP_ZERO,通过 post_alloc_hook 清零页面(参考搜索结果中的 get_zeroed_page 流程)。

 

三、关键机制解析

 

1. 内存碎片控制

ALLOC_NOFRAGMENT 标志:强制优先从本地节点分配,减少跨节点碎片化。

 

迁移类型回退:若首选迁移类型(如 MIGRATE_UNMOVABLE)无空闲块,尝试其他类型(如 MIGRATE_RECLAIMABLE)。

 

2. 水位线与内存回收

水位线触发行为 条件 操作

快速分配 空闲页 ≥ 水位线 直接分配

异步回收 空闲页 < 水位线但允许回收 触发 node_reclaim 回收非活跃页

延迟页初始化处理 启用 CONFIG_DEFERRED_STRUCT_PAGE_INIT 调用 _deferred_grow_zone 初始化延迟页

 

3. 性能优化设计

本地节点优先:减少跨 NUMA 节点访问延迟。

 

快速路径剪枝:通过 zone_watermark_fast 快速过滤不满足条件的 Zone。

 

四、典型场景与代码路径

 

场景1:普通单页分配(order=0)

alloc_pages(GFP_KERNEL, 0);

路径:rmqueue → 从每 CPU 页缓存(PCP)直接分配,避免全局锁竞争。

 

场景2:高阶连续内存分配(order=5)

alloc_pages(GFP_HIGHUSER, 5);

路径:遍历 Zone 检查水位线 → 若失败触发 node_reclaim → 调用 rmqueue 分裂高阶块。

 

场景3:强制清零页面(__GFP_ZERO)

get_zeroed_page(GFP_KERNEL);

路径:prep_new_page → post_alloc_hook → kernel_init_free_pages 清零内存(参考搜索结果中的 get_zeroed_page 流程)。

 

五、与慢速路径的衔接

若 get_page_from_freelist 失败(返回 NULL),上层函数 __alloc_pages_nodemask 将进入慢速路径:

内存回收:调用 __perform_reclaim 回收页缓存或 Slab 内存。

内存压缩:通过 __alloc_pages_direct_compact 移动页面以合并大块内存。

OOM Killer:若仍无法分配,终止进程释放内存。

总结:get_page_from_freelist 是伙伴系统的快速分配核心,通过水位线检查、碎片控制和高阶块分裂机制,在理想情况下(内存充足、无碎片)高效分配连续物理页。其设计在保证性能的同时,与慢速路径协同处理低内存场景。

 

相关文章:

  • LeetCode 2537.统计好子数组的数目:滑动窗口(双指针)
  • HackMyVM - TryHarder
  • Linux》》bash 、sh 执行脚本
  • 大厂面试:六大排序
  • 各种排序算法
  • 从 BI 与 SQL2API 的差异,看数据技术的多元发展路径
  • 网络原理 - 初识网络 1
  • vue3.2 + element-plus 实现跟随input输入框的弹框,弹框里可以分组或tab形式显示选项
  • 操作系统之shell实现(上)
  • 力扣DAY52-54 | 热100 | 图论:腐烂的橘子、课程表、前缀树
  • 解决Flutter 2.10.5在升级Xcode 16后的各种报错
  • Linux网络编程第一课:深入浅出TCP/IP协议簇与网络寻址系统
  • 源码分析之Leaflet中Map类扩展方法之ScrollWheelZoom
  • Redis核心数据类型在实际项目中的典型应用场景解析
  • git UserInterfaceState.xcuserstate 文件频繁更新
  • 【正点原子STM32MP257连载】第四章 ATK-DLMP257B功能测试——IMX335摄像头测试 #MIPI CSI
  • lodash-es 详解
  • 矩阵基础+矩阵转置+矩阵乘法+行列式与逆矩阵
  • TensorRT模型部署剪枝
  • Day92 | 灵神 | 二叉树 路径总和
  • 抖音小程序开发工具/湖南百度seo
  • 网站程序0day/seo技术中心
  • 手机网站缩放/水平优化
  • 厦门湖里区建设局网站/百度一下手机版网页
  • wordpress商城+微信/seo搜索引擎实训心得体会
  • 抚州哪里有做企业网站的公司/搜索引擎排名营销