软件版本FCCU(故障采集与控制单元)设计
文章目录
- 一、模块概述
- 二、架构与数据流
- 1. 系统架构
- 2. 数据与事件流
- 3. 时序图
- 三、关键数据结构
- 四、主要接口说明
- 四、核心流程与接口
- 1. 故障注册与校验
- 2. 故障采集与优先级队列
- 3. 多态AO异步后处理
- 4. 队列溢出与保护
- 5. 故障恢复与查询
- 6. NVM日志与断电保护
- 7. 日志与复位权限
- 五、示例demo
一、模块概述
一般FCCU(Fault Collection and Control Unit)为系统级故障管理与安全控制硬件模块,适用于嵌入式、工业、车载等高安全场景。
我的FCCU其实是软件版本的FCCU,主要作用是:
- 统一收集全系统(软硬件)故障
- 对故障分类、队列缓存、状态维护、持久化
- 根据故障属性自动采取不同的后处理措施(如紧急处理、复位、输出安全信号)
- 支持用户自定义后处理钩子
- 提供系统级/业务级“故障快照”与“诊断信息”查询接口
本方案采用QPC事件驱动、多级环形队列池和多态活动对象。
二、架构与数据流
1. 系统架构
- 故障注册表(struct FCCU_FaultTableEntry):静态/动态注册,含故障码、属性、阈值、钩子
- 多级环形队列池(struct FCCU_QueueSet):每优先级独立SPSC环形队列,静态buffer,事件对象池分配
- 多态活动对象(struct FCCU_ActiveObject):按优先级分流后处理
- NVM抽象层(struct FCCU_NvmOps):统一接口,日志持久化、断电保护
- 并发保护:QPC临界区、SPSC安全
- 日志与权限控制:敏感操作均校验权限并记录日志
- 恢复与查询接口:故障恢复、活跃状态查询
2. 数据与事件流
3. 时序图
三、关键数据结构
/* 故障队列项 */
struct FCCU_VmEntry
{uint8_t fault_index; /* 故障索引号 */uint64_t fault_detail; /* 故障详细信息 */uint32_t count; /* 计数器,用于去重或统计 */
};/* 故障注册表项 */
struct FCCU_FaultTableEntry
{uint32_t fault_code; /* 故障代码 */uint32_t attr; /* 故障属性(位域等) */uint32_t err_threshold; /* 故障触发阈值 */int32_t (*user_hook)(uint32_t, uint64_t, bool); /* 用户自定义钩子 */
};/* 事件对象(继承自QEvt) */
struct FCCU_Event
{struct QEvt super; /* QPC事件基类 */uint8_t priority; /* 故障优先级 */uint8_t fault_index; /* 故障索引 */uint64_t fault_detail; /* 故障详细信息 */
};/* 多级优先级环形队列集合 */
struct FCCU_QueueSet
{struct SpscQueue *queue[FCCU_QUEUE_LEVELS]; /* 各优先级的环形队列指针 */uint8_t level_count; /* 队列级数 */uint32_t item_size; /* 每项大小 */
};
四、主要接口说明
/*** @brief 初始化 FCCU 故障采集与控制单元*/
void Fccu_Init(void);/*** @brief 上报故障点* @param fault_index 故障索引号* @param fault_detail 故障详细信息* @param priority 故障优先级(数值越小,优先级越高)* @retval 0 成功,负数失败*/
int32_t Fccu_ReportFaultPoint(uint32_t fault_index, uint64_t fault_detail, uint8_t priority);/*** @brief 后处理事件处理(由活动对象调度)* @param ao 活动对象指针* @param ao_priority 活动对象优先级*/
void Fccu_ProcessPostEvent(struct QActive *ao, uint8_t ao_priority);/*** @brief 主动清除某个故障状态(人工恢复/自愈)* @param fault_index 故障索引号*/
void Fccu_ClearFault(uint32_t fault_index);/*** @brief 查询所有当前未恢复的故障* @retval 活跃故障数量*/
uint16_t Fccu_GetActiveFaults(void);/*** @brief 设置队列溢出回调函数* @param callback 用户自定义溢出回调*/
void Fccu_SetQueueOverflowCallback(void (*callback)(void));/*** @brief 注册用户自定义故障处理钩子* @param fault_index 故障索引号* @param user_hook 用户钩子函数指针* @retval 0 成功,负数失败*/
int32_t Fccu_RegisterUserHook(uint32_t fault_index, int32_t (*user_hook)(uint32_t, uint64_t, bool));
四、核心流程与接口
1. 故障注册与校验
- 支持静态/动态注册,启动时校验完整性(如MD5)
- 可配合NVM保存注册表信息
2. 故障采集与优先级队列
- FCCU_ReportFaultPoint(faultIdx, detail, priority):模块上报故障,自动去重/计数/阈值判断
- 按优先级推入对应环形队列,静态分配事件对象
- 队列满时调用溢出回调/日志
3. 多态AO异步后处理
- 各优先级AO活动对象异步从队列池取出事件处理
- 支持日志NVM、寄存器/Pin、系统复位、钩子、恢复
- AO可根据业务场景灵活扩展
4. 队列溢出与保护
- 多级队列溢出计数与告警,支持外部回调
- 溢出时日志记录或紧急上报
5. 故障恢复与查询
- FCCU_ClearFault:主动恢复单项故障
- FCCU_GetActiveFaults:查询所有活跃故障
6. NVM日志与断电保护
- NVM接口可mock,支持文件/FALSH/EEPROM等多种实现
- 支持flush、CRC校验、断电保护
7. 日志与复位权限
- 所有敏感操作(如系统复位)均有日志与权限校验
五、示例demo
- 在linux平台借助QPC实现FCCU demo工程: https://gitee.com/liudegui/fccu_linux_demo
- 代码结构
- 执行结果
$ ./fccu_demo
=== FCCU Demo Start ===
[FCCU] Initialization complete
sizeof(struct FCCU_VmEntry) = 32
[FCCU] Register user_hook for idx=3
[FCCU] Report fault: idx=1, detail=0x68691eca, priority=0
[FCCU] Report fault: idx=2, detail=0x68691ecb, priority=1
[FCCU] Report fault: idx=3, detail=0x68691ecc, priority=0
[FCCU] Active faults: 3
[FCCU] Fault idx=1 cleared
[FCCU] Active faults: 2
[AO_P0] Handle fault idx=1, detail=0x68691eca[user_hook_minor] code=0x01010002, detail=0x68691eca, first=1[AO_P0] user_hook return: 200
[AO_P0] Handle fault idx=3, detail=0x68691ecc
[Demo] my_custom_hook: code=0x01010004, detail=0x68691ecc, first=1[AO_P0] user_hook return: 888
[AO_P1] No pending faults
=== FCCU Demo End ===
- 显示 FCCU 初始化完成及结构体大小。
- 显示 user_hook 注册成功。
- 每次上报打印索引、详细信息、优先级。若队列溢出,触发溢出回调。
- 显示当前活跃故障数量,清除后数量减少。
- 按优先级弹出并处理队列中的故障项,调用对应 user_hook 并显示返回值。若无待处理故障,打印提示。
- 若注册了自定义 user_hook,会在处理对应故障时被调用并打印自定义内容。