当前位置: 首页 > news >正文

Linux电源管理(3)_关机和重启的过程

原文:Linux电源管理(3)_Generic PM之重新启动过程

1.前言

在使用计算机的过程中,关机和重启是最先学会的两个操作。同样,这两个操作在Linux中也存在,可以关机和重启。这就是这里要描述的对象。在Linux Kernel中,主流的关机和重新启动都是通过“ reboot”系统调用(具体可参考kernel / sys.c)来实现的。另外,除了我们常用的shutdown和restart两类操作之外,该系统调用也提供了其他的reboot方式,也会在这里一一说明。

2.内核支持的reboot方式

也许你会奇怪,reboot是重启的意思,所以用它实现Restart是合理的,但怎么用它实现关机操作呢?答案是这样的:关机之后,早晚也会开机啊!所以关机是一种特殊的重新启动过程,只不过持续的时间有点长而已。所以,内核根据不同的表现方式,将重新启动分成如下的几种方式:

​​​​​​​

   1: / *   2: * _reboot()系统调用接受的命令。   3: *   4: *重新启动使用默认命令和模式重新启动系统。   5: * HALT停止OS,并将系统控制权交给ROM监视器(如果有)。   6: * CAD_ON Ctrl-Alt-Del序列导致RESTART命令。   7: * CAD_OFF Ctrl-Alt-Del序列将SIGINT发送到初始化任务。   8: * POWER_OFF如果可能,请停止OS并从系统中断开所有电源。   9: * RESTART2使用给定的命令字符串重新启动系统。  10: * SW_SUSPEND使用软件挂起的挂起系统(如果已编译)。  11: * KEXEC使用先前加载的Linux内核重新启动系统  12: * /  13:           14: #define LINUX_REBOOT_CMD_RESTART 0x01234567  15: #define LINUX_REBOOT_CMD_HALT 0xCDEF0123  16: #define LINUX_REBOOT_CMD_CAD_ON 0x89ABCDEF  17: #define LINUX_REBOOT_CMD_CAD_OFF 0x00000000  18: #define LINUX_REBOOT_CMD_POWER_OFF 0x4321FEDC  19: #define LINUX_REBOOT_CMD_RESTART2 0xA1B2C3D4  20: #define LINUX_REBOOT_CMD_SW_SUSPEND 0xD000FCE2  21: #define LINUX_REBOOT_CMD_KEXEC 0x4558454

操作类型

英文全称/别名

功能描述

备注

RESTART

Restart

正常重启系统,重新加载内核和用户空间。

用户最常用的重启方式,等同于

reboot

命令。

HALT

Halt

停止操作系统,将控制权交给其他代码(如 BIOS/UEFI 或监控程序)。

表现形式依赖具体硬件实现,可能完全断电或进入低功耗状态。

CAD_ON/CAD_OFF

Ctrl+Alt+Del On/Off

允许/禁止通过

Ctrl+Alt+Del

组合键触发重启(RESTART)。

需键盘驱动支持,默认行为由内核配置决定。

POWER_OFF

Power Off

正常关机,停止操作系统并切断电源(ACPI 状态

S5

)。

等同于

poweroff

命令,需硬件支持完全断电。

RESTART2

Restart with Command

重启时携带自定义字符串(

cmd

),传递给关注重启事件的进程或机器相关代码。

用途由设备厂商自定义(如安卓的恢复模式)。

SW_SUSPEND

Software Suspend

挂起到内存(Suspend-to-RAM)或磁盘(Hibernate),进入低功耗状态。

依赖

CONFIG_SUSPEND

内核选项,详见后续休眠专题。

KEXEC

Kernel Execute

跳过 BIOS/UEFI,直接重启到预加载的其他内核镜像(需

CONFIG_KEXEC

支持)。

用于快速内核热替换或崩溃恢复(如

kexec -l

加载新内核)。

3.重新启动相关的操作流程

在Linux操作系统中,可以通过重新启动,停止,关闭电源等命令,启动重新启动,具体的操作流程如下:

一般的Linux操作系统,在用户空间都提供了一些工具集合(如常在嵌入式系统使用的Busybox),这些工具集合包含了重新引导,停止和关机三个和重新引导相关的命令。

用户空间程序通过reboot系统调用,进入内核空间,内核空间根据执行路径的不同,提供了kernel_restart,kernel_halt和kernel_power_off三个处理函数,响应用空间的reboot请求这三个处理函数的处理流程大致相同,主要包括:向有关重新引导过程的进程发送通知事件;调用驱动程序核心模块提供的接口,关闭所有的外部设备;调用驱动程序syscore模块提供的接口,关闭系统核心;调用架构相关的处理函数,进行后续的处理;最后,调用计算机相关的接口,实现真正意义上的重新启动另外,采用TTY模块提供的Sysreq机制,内核提供了其他途径的关机方法,如某些按键组合,向/ proc文件写入命令等

4.重新启动过程的内部动作和代码分析

4.1重启系统调用

重新启动系统调用的实现位于“ kernel / sys.c”,其函数原型如下:​​​​​​​

   1: SYSCALL_DEFINE4(reboot,int,magic1,int,magic2,unsigned  int,cmd,   2:                 void __user *,arg)reboot,该系统调用的名称。magic1,magic2,两个int类型的“魔力数”,用于防止误操作。具体在“ include / uapi / linux / reboot.h”中定义,感兴趣的同学可以去看看(话说这些数字还是蛮有意思的,例如Linus同学及其家人的生日就在里面,猜出来的可以在文章下面留言)。cmd,第2章所描绘的reboot方式。arg,其他的额外参数。

reboot系统调用的内部动作比较简单:

1)确定调用者的用户权限,如果不是超级用户(superuser),则直接返回错误(这也是我们再用户空间执行reboot,halt,poweroff等命令时,必须是root用户的原因);

2)判断预测的魔术数是否匹配,如果不匹配,直接返回错误。这样就可以进行的防止误动作发生;

3)调用reboot_pid_ns接口,检查是否需要由该接口处理reboot请求。

4)如果是POWER_OFF命令,且没有注册电源关闭的机器处理函数(pm_power_off),把该命令转换为HALT命令;

5)根据特定的cmd命令,执行具体的处理,包括,

      如果是RESTART或RESTART2命令,调用kernel_restart。

      如果是CAD_ON或CAD_OFF命令,更新C_A_D的值,则表示允许通过Ctrl + Alt + Del组合键重新启动系统。

      如果是HALT命令,调用kernel_halt。

      如果是POWER_OFF命令,调用kernel_power_off。

      如果是KEXEC命令,调用kernel_kexec接口

      如果是SW_SUSPEND,则调用hibernate接口

6)返回上述的处理结果,系统调用结束。

4.2 kernel_restart,kernel_halt和kernel_power_off

1)调用kernel_xxx_prepare函数,进行重新启动/停止/ power_off前的准备工作,包括,

      调用blocking_notifier_call_chain接口,向关心reboot事件的进程,发送SYS_RESTART,SYS_HALT或SYS_POWER_OFF事件。并发送出去。

      将系统状态设置为相应的状态(SYS_RESTART,SYS_HALT或SYS_POWER_OFF)。

      调用usermodehelper_disable接口,禁止用户模式辅助

      调用device_shutdown,关闭所有的设备

2)如果是power_off,并且存在PM相关的power off prepare函数(pm_power_off_prepare),则调用该调用函数;

3)调用migrate_to_reboot_cpu接口,将当前的进程(任务)移到一个CPU上;

注2:对于多CPU的机器,无论由哪个CPU触发了当前的系统调用,代码都可以运行在任意的CPU上。这个接口将代码分派到一个特定的CPU上,并禁止调度器分派代码到其他CPU上。首先,这个接口被执行后,只有一个CPU在运行,用于完成后续的重新启动动作。

4)调用syscore_shutdown接口,将系统核心器件关闭(例如中断等);

5)调用printk以及kmsg_dump,向这个世界发出最后的声音(打印日志);

6)最后,由machine-core的代码,接管后续的处理。

4.3 device_shutdown

设备模型中和device_shutdown有关的逻辑包括:

1.每个设备(结构设备)都会保存该设备的驱动(结构设备驱动程序)指针,以及该设备所在的总线(结构总线类型)的指针

2.设备驱动中有一个名称为“ shutdown”的某种函数,用于在device_shutdown时,关闭该设备

3.总线中也有一个名称为“ shutdown”的某种函数,用于在device_shutdown时,关闭该设备

4.系统的所有设备,都存在于“ / sys / devices /”目录下,而该目录由名称为“ devices_kset”的kset表示。kset中会使用一个链表保存其下所有的kobject(也即“ / sys / devices /”目录下的所有设备)。”的最终结果就是,以“ devices_kset”为根目录,将内核中所有的设备(以相应的kobject为代表),组织成一个树状结构

device_shutdown的实现,该接口位于“ drivers / base / core.c”中,执行逻辑如下。​​​​​​​

   1: / **   2: * device_shutdown-在每个设备上调用-> shutdown()以关闭。   3: * /   4: 无效device_shutdown(void)   5: {   6:         结构设备* dev,* parent;   7:            8:          spin_lock(&devices_kset-> list_lock);   9:         / *  10:          *向后移动设备列表,依次关闭每个设备。  11:          *请注意,设备拔出事件也可能会开始拉  12:          *设备离线,即使系统正在关闭。  13:          * /  14:         while (!list_empty(&devices_kset->list)) {  15:                 dev = list_entry(devices_kset->list.prev, struct device,  16:                                 kobj.entry);  17:   18:                 /*  19:                  * hold reference count of device's parent to  20:                  * prevent it from being freed because parent's  21:                  * lock is to be held  22:                  */  23:                 parent = get_device(dev->parent);  24:                 get_device(dev);  25:                 /*  26:                  * Make sure the device is off the kset list, in the  27:                  * event that dev->*->shutdown() doesn't remove it.  28:                  */  29:                 list_del_init(&dev->kobj.entry);  30:                 spin_unlock(&devices_kset->list_lock);  31:   32:                 /* hold lock to avoid race with probe/release */  33:                 if (parent)  34:                         device_lock(parent);  35:                 device_lock(dev);  36:   37:                 /* Don't allow any more runtime suspends */  38:                 pm_runtime_get_noresume(dev);  39:                 pm_runtime_barrier(dev);  40:   41:                 if (dev->bus && dev->bus->shutdown) {  42:                         if (initcall_debug)  43:                                 dev_info(dev, "shutdown\n");  44:                         dev->bus->shutdown(dev);  45:                 } else if (dev->driver && dev->driver->shutdown) {  46:                         if (initcall_debug)  47:                                 dev_info(dev, "shutdown\n");  48:                         dev->driver->shutdown(dev);  49:                  }  50:   51:                  device_unlock(dev);  52:                 如果(父母)  53:                          device_unlock(parent);  54:   55:                  put_device(dev);  56:                  put_device(父);  57:   58:                  spin_lock(&devices_kset-> list_lock);  59:          }  60:          spin_unlock(&devices_kset-> list_lock);  61:          async_synchronize_full();  62: }

4.4 system_core_shutdown

系统核心的关机和设备的关机类似,也是从一个链表中,遍历所有的系统核心,并调用它的关机接口。

4.5 machine_restart,machine_halt和machine_power_off

虽然以machine_为预先命名,这三个接口却是属于架构相关的处理函数,如ARM。以ARM为例,它们在“ arch / arm / kernel / process.c”中实现,具体如下。

4.5.1机器重启​​​​​​​

   1: / *   2: *重新启动要求辅助CPU停止执行任何活动   3: *,同时主CPU重置系统。具有单个CPU的系统可以   4: *使用soft_restart()作为其机器描述符的.restart钩子,因为   5: *将导致唯一可用的CPU复位。具有多个CPU的系统必须   6: *提供硬件重新启动实施,以确保所有CPU立即复位。   7: *这是必需的,以便在主CPU上复位后运行的任何代码   8: *不必与其他CPU协调以确保它们仍然不处于运行状态   9: *执行预重置代码,并使用主CPU的代码希望的RAM  10: *使用。实施这种协调基本上是不可能的。  11: * /  12: void machine_restart(char * cmd)  13: {  14:          smp_send_stop();  15:   16:          arm_pm_restart(reboot_mode,cmd);  17:   18:         / *给失败的宽限期1s * /  19:          mdelay(1000);  20:   21:         / *糟糕-平台无法重新启动。告诉用户!* /  22:          printk(“重新启动失败-系统停止\ n”);  23:          local_irq_disable();  24:         而(1);  25: }

0)先转述一下该接口的注释;

对于多CPU的机器而言,重新启动之前必须保证其他的CPU位于非活动状态,由其中一个主CPU负责重新启动动作。并且,必须实现一个基于硬件的重新启动操作,以保证所有CPU同步重启,这是设计的重点!

对于单CPU机器而言,就相对简单了,可以直接用软件reset的方式实现重启。

1)调用smp_send_stop接口,确保其他CPU位于非活动状态;

2)调用机器相关的重启接口,实现真正的重启。该接口是一个变量函数,由“ arch / arm / kernel / process.c”声明,由具体的机器代码实现。格式如下:

      void(* arm_pm_restart )(char str,const char * cmd)= null_restart;

      EXPORT_SYMBOL_GPL(arm_pm_restart);

3)等待1s;

4)如果没有返回,则重启成功,否则失败,打印错误信息。

4.5.2 machine_halt

ARM的halt很简单,就是将其他CPU停下来,并禁止当前CPU的中断后,死循环!确实,中断被禁止了,又死循环了,不halt才怪。代码如下:​​​​​​​

   1: / *   2: *停止仅要求辅助CPU停止执行任何操作   3: *活动(执行任务,处理中断)。smp_send_stop()   4: *实现此目标。   5: * /   6: void machine_halt(void)   7: {   8:          smp_send_stop();   9:   10:          local_irq_disable();  11:         而(1)  12: }

4.5.3 machine_power_off

power off动作和restart类似,即停止其他CPU,调用其他函数。power off的某些函数和restart类似,就不再说明了。

5.总结与思考

5.1建筑和机器的概念

本文是我们在分析Linux内核时第一次遇到架构和机器的概念,顺便解释一下。内核代码中最常见的目录结构就是:arch / xxx / mach-xxx /(例如arch / arm / mach-bcm /)。由该目录结构可知,架构(简称arch)是指具体的体系结构,如ARM,X86等。机器呢,是指具体体系结构下的一个或多个的SOC,如bcm等。

5.2电源管理驱动(和reboot有关的部分)需要实现的内容

由上面的分析可知,在Reboot的过程中,大部分的逻辑是否内核处理的,具体的驱动程序需要关注2点即可:

1)实现各自的关机接口,以正确关闭对应的设备

2)实现机器相关的接口,以确保足够的机器可以正确重启或关闭电源

看来还是很简单的

相关文章:

  • 第十六届蓝桥杯 2025 C/C++组 密密摆放
  • 探索语音增强中的多尺度时间频率卷积网络(TFCM):代码解析与概念介绍
  • AI赋能的问答系统:2025年API接口实战技巧
  • 【Redis——数据类型和内部编码和Redis使用单线程模型的分析】
  • 基于Arduino的STM32F103RCT6最小系统板的测试及串口通讯
  • 深度学习中的优化算法:基础全面解析
  • 聊聊Spring AI Alibaba的PlantUMLGenerator
  • 安装deepspeed时出现了以下的错误,如何解决CUDA_HOME does not exist
  • 【Java面试笔记:进阶】28.谈谈你的GC调优思路?
  • 解决STM32H743单片机USB_HOST+FATF操作usb文件
  • 从 Pretrain 到 Fine-tuning:大模型迁移学习的核心原理剖析
  • 实验六 文件操作实验
  • CISC与RISC详解:定义、区别及典型处理器
  • 使用 ECharts 在 Vue3 中柱状图的完整配置解析
  • 【安全扫描器原理】端口扫描
  • 4.2.3 MYSQL事务原理分析
  • ESM模块加载机制全景解析
  • docker部署的Nextcloud,处于维护模式,如何解决
  • 程序员如何用AI工具实现“快速验证原型”
  • Linux环境变量以及进程虚拟地址原理
  • “铁血防守”制造8年最快丢球,恐惧中的阿森纳什么也做不了
  • 解放日报:持续拿出排头兵姿态先行者担当
  • 媒体:黑话烂梗包围小学生,“有话好好说”很难吗?
  • 新质观察|重塑低空经济的系统安全观
  • 光明网评论员:手机“二次放号”,需要重新确认“你是你”
  • 影子调查丨危房之下,百余住户搬离梦嘉商贸楼