论文解读:利用中断隔离技术的 Linux 亚微秒响应性能优化
近日,国科环宇望获实时Linux团队在处理器实时调度技术方面取得重大突破,将Linux实时性从微秒级实时提升至亚微秒级。该延迟指标采用端到端硬件IO信号响应进行严格计量,包括物理信号传输、处理器内部总线传输、中断响应和软件调度等全部环节的总延迟不超过480纳秒,其中最小响应延迟约400纳秒、延迟抖动不超过80纳秒。
该系统最大响应延迟指标比传统实时Linux提升了1~2个数量级,达到了目前全球最快的Linux实时性指标,也超过了微内核实时操作系统,可替代传统的双内核系统、上下位机系统和部分CPU+FPGA架构,广泛应用于机器人、自动驾驶、GPU集群计算、工业控制、精密仪器、航空航天、网络通信、金融电力等领域,大幅简化系统设计、降低硬件成本、提高运行效率和安全性。
本文将对国科环宇最新发表的论文(《Towards Deterministic Sub-0.5 us Response on Linux through Interrupt Isolation》-- https://arxiv.org/abs/2509.03855)进行解读。
该论文讨论了通过中断隔离技术在Linux操作系统中实现确定性的亚微秒响应。文章提出了一种新的方法,旨在解决Linux操作系统中定时器中断和处理器间中断(IPIs)对实时响应时间的影响,从而达到低延迟、低抖动的实时系统表现。
本文测试镜像及测试代码可通过下方链接免费下载试用
https://www.onewos.com/resource-center/iso
【Linux极限探索之一】亚微秒级系统响应 - 基于飞腾派的IO响应
1. 问题背景与动机
Linux作为一种通用操作系统,最初并未设计用于严格的实时性要求。尤其是在实时应用中,定时器中断(如周期性“滴答”)和处理器间中断(IPIs)会干扰系统的响应时间,使得一些任务无法满足严格的延迟要求。特别是在高频交易等延迟要求极其苛刻的领域,即使是纳秒级别的抖动也可能影响系统性能。
2. 现有方法的不足
现有的Linux实时扩展(如PREEMPT-RT)虽能减少中断的干扰,但依然不能完全消除定时器中断和IPIs带来的延迟。这些机制主要通过降低定时器中断频率(如NOHZ_FULL)来减小干扰,但仍然无法完全避免这些中断,尤其是在系统需要更高精度和低延迟的场景中。
3. 中断隔离方法
为了解决这个问题,作者提出了一种新的中断隔离方法,具体包括两个关键技术创新:
- 集中定时器处理:通过将定时器中断的处理集中到特定的API上,从而减少对实时核心的干扰。实时应用可以根据需要显式调用该API来执行定时器任务,这样就能避免周期性定时器中断带来的不确定性。
- IPI选择性屏蔽:针对性地屏蔽不会对隔离核产生副作用的IPI,从而避免了IPIs引起的不可预测的上下文切换和中断。这个方法确保了实时任务的隔离核心不会被来自其他核心的干扰。
4. 实现细节
作者通过修改Linux内核,屏蔽在隔离核心上执行周期性定时器和非必要的IPI。通过一个专用的API,实时任务可以控制何时执行定时器相关的工作。这种机制避免了常规中断,并确保数据的传输可以在不产生异步中断的情况下进行。
5. 实验评估:示波器与响应延迟
为了验证所提出的中断隔离方法对系统响应时间和抖动的改善,作者设计了一系列实验,并利用示波器对系统响应进行了长时间的测量。通过示波器的持续模式(Persistence Mode)功能,实验能够直观展示系统响应时间的变化,尤其是检测到的最短和最长响应时间。这对于评估系统的确定性和稳定性至关重要。
实验中采用了两种主要的测试方法:
- 1. 外部信号生成器与GPIO触发实验:使用信号发生器提供200kHz频率的输入信号,开发板触发GPIO信号,示波器实时监测响应。
- 2. 基于时间戳计数器的GPIO切换实验:通过读取CPU时间戳计数器,周期性地切换GPIO信号。此方法排除了外部信号源的干扰,确保了在不同配置下的响应延迟和稳定性评估。
通过示波器的持续模式,实验能够显示长时间内多个响应的波形,具体展示了系统响应的最小值、最大值和抖动。例如,在隔离技术下,最短响应时间为390纳秒,最大响应延迟为470纳秒,抖动为80纳秒。而PREEMPT-RT系统最短响应时间为4.1微秒,最大响应为72微秒,抖动为67.9微秒。
6. 跨核心通信延迟测量
为了模拟跨核心的通信,实验中让核心A通过GPIO和IPI向核心B发送信号,核心B响应并通过GPIO输出信号。示波器在此实验中的应用能够直观显示GPIO信号在两核心之间传输的延迟。
使用隔离技术时,跨核心通信的延迟始终保持在子微秒范围内,最小延迟约为120纳秒,最大延迟不超过160纳秒,抖动保持在40纳秒以内。相比之下,PREEMPT-RT配置下,跨核心通信的延迟有时会达到超过2微秒。
7. 总结
通过示波器的长期实验,作者展示了中断隔离技术如何显著提高系统响应时间的确定性,特别是在GPIO响应、跨核心通信等实时任务中。示波器不仅帮助量化了响应延迟,还通过可视化展示了不同系统配置下的抖动情况,这为验证和优化实时系统提供了非常直观的数据支持。
这些实验结果进一步强调了中断隔离技术在低延迟、高精度实时应用中的巨大潜力。通过示波器的帮助,能够精确评估系统性能,确认该技术能有效解决Linux等通用操作系统在实时任务中的不确定性问题。
在实际应用中,该技术可深度赋能 PLC、运动控制器、机器人、数控机床、航空航天精密测控、金融高频交易等对时延敏感的核心场景,提供稳定可靠的亚微秒级实时性支持。其 480 纳秒以内的响应延迟与 80 纳秒以下的抖动表现,能将工业设备控制精度提升一个数量级,让机器人关节运动误差趋近微米级、感知与决策间隔压缩至微秒级,同时大幅简化传统 “CPU+FPGA”“双内核” 等复杂架构设计,降低硬件部署与维护成本。凭借对 x86、ARM、LoongArch 等多架构的适配能力及国产化解决方案支撑,该技术在工业 4.0 升级、高端装备制造、关键基础设施建设等领域具有不可替代的应用价值与广阔前景。
本文测试镜像及测试代码可通过下方链接免费下载试用
https://www.onewos.com/resource-center/iso