当前位置: 首页 > news >正文

gralloc usage flags

下面这些示例主要说明了 gralloc usage flags 在图像处理和多媒体应用中如何影响性能和正确性。让我们逐个详细分析每个问题的 根因修复方案,并深入解析 gralloc 标志对 缓存管理数据流 的影响。


Example 1: 长曝光快照耗时异常

📌 问题描述
  • 症状:长曝光快照(long exposure snapshot)在某些内存优化后,拍摄时间异常变长。
  • 根因
    1. 第三方算法 在多个快照帧上执行,耗时约 1.2 秒
    2. Buffer 分配时,生产者和消费者的 gralloc 标志设置不正确,均为:
       
      GRALLOC1_PRODUCER_USAGE_CAMERA
      GRALLOC1_CONSUMER_USAGE_CAMERA
      

      该标志适用于硬件组件(如 ISPGPU)的读写,不启用 CPU 缓存,导致 CPU 访问缓慢。
    3. 由于 CPU 无法直接利用缓存,每次处理都需要直接从主内存读取,增加了 1 秒 的延迟。
📌 修复方法
  1. 启用 CPU 缓存,在 producerconsumer 侧分别增加以下标志:
     
    GRALLOC1_PRODUCER_USAGE_CPU_WRITE
    GRALLOC1_CONSUMER_USAGE_CPU_READ
    

    1. 该修改优化了 CPU 对缓冲区的读写,减少了 CPU 直接访问内存的延迟。
📌 技术解析
  • GRALLOC1_PRODUCER_USAGE_CPU_WRITE:允许 CPU 快速写入缓冲区,避免每次都进行缓慢的直接内存访问。
  • GRALLOC1_CONSUMER_USAGE_CPU_READ:启用 CPU 缓存加速,确保消费者(如第三方算法)能快速读取数据。
  • 缓存管理操作
    • 写回缓存 (Flush):确保 CPU 写入数据对其他设备(如 GPUISP)可见。
    • 无效缓存 (Invalidate):使 CPU 能够读取其他设备写入的最新数据。
📌 总结

不正确的 gralloc 标志 会导致 CPU 直接访问 DDR,性能低下。正确的设置允许 CPU 使用缓存,从而显著提升图像处理速度。


Example 2: CHI 中元数据缓冲区未接收

📌 问题描述
  • 症状:在 Camera HAL Interface (CHI) 中无法接收到元数据缓冲区。
  • 根因
    1. 缓存标志未正确设置,导致元数据的 回调 (callback) 延迟。
    2. 超时 (timeout) 发生,导致 usecase 未及时处理缓冲区,回调无法返回数据。
📌 修复方法
  1. 为消费者(CHI)添加以下缓存标志:
     
    GRALLOC1_CONSUMER_USAGE_CPU_READ_OFTEN
    

  2. 该标志允许 CPU 高效地、频繁地读取缓冲区数据,确保元数据能及时回传至 CHI
📌 技术解析
  • 元数据缓冲区 通常是 CPU 读取的,未设置缓存标志会导致:

    • CPU 直接访问 DDR,无法利用缓存,数据读取慢,导致回调超时。
    • 回调机制 依赖于及时读取的数据,未及时读取会触发超时。
  • GRALLOC1_CONSUMER_USAGE_CPU_READ_OFTEN 的作用:

    • 频繁 CPU 读取:为 CPU 启用缓存,适合多次读取的元数据。
    • 避免超时:确保数据尽快传递到 CHI,及时触发回调。
📌 总结

当 CPU 需要频繁读取元数据时,正确设置 CPU_READ_OFTEN 标志可以显著提高数据读取速度,避免回调超时。


Example 3: 视频录制出现帧丢失 (Frame Drop)

📌 问题描述
  • 症状:在视频录制过程中,出现帧丢失,导致录制的画面不流畅。
  • 根因
    1. 部分 buffer 处理未使用正确的 gralloc 标志,导致 CPU/GPU 数据交换延迟。
    2. 未正确设置缓存,影响了数据传输速度,造成帧缓冲区处理不及时,丢失帧。
📌 修复方法

根据缓冲区的实际使用场景,增加以下 gralloc 标志:

 
GRALLOC1_PRODUCER_USAGE_SW_WRITE_OFTEN
GRALLOC1_CONSUMER_USAGE_SW_READ_OFTEN
GRALLOC1_PRODUCER_USAGE_HW_VIDEO_ENCODER

  • SW_WRITE_OFTEN:允许 CPU 频繁写入缓冲区,适用于连续数据写入(如视频帧)。
  • SW_READ_OFTEN:允许 CPU 频繁读取缓冲区,保证解码器及时取走数据。
  • HW_VIDEO_ENCODER:指定缓冲区用于硬件视频编码,允许高效的数据传输。
📌 技术解析
  • CPU/GPU 协作瓶颈
    视频录制需要 CPU 将帧数据写入缓冲区,GPU硬件编码器 读取进行编码,缓冲区访问需要高效。
  • 缓存优化
    • 写缓存 (Write-back):确保 CPU 写入的数据及时同步到 GPU
    • 读缓存 (Invalidate):保证 CPU 读取最新的编码数据,防止数据滞后。
📌 总结

在高实时性场景(如视频录制),正确设置 缓存标志 可以避免帧丢失,提升数据传输速度和整体性能。


🧐 总结:gralloc usage flags 对性能的影响

  1. CPU 缓存管理

    • 读缓存 (CPU_READ_OFTEN):提高多次读取速度,防止数据延迟。
    • 写缓存 (CPU_WRITE_OFTEN):加速数据写入,确保多设备之间的数据一致性。
  2. 硬件编码器 (HW_VIDEO_ENCODER)

    • 启用硬件视频加速,适配 GPUDSPISP 等异构设备。
  3. 多设备协作

    • 设置适当的 producerconsumer 标志,确保数据在 CPUGPUDSP 之间高效传输,避免延迟和超时。

相关文章:

  • 关于QMetaObject::invokeMethod的作用和用法
  • Rust 生命周期
  • 【深度学习与大模型基础】第7章-特征分解与奇异值分解
  • python鸢尾花
  • 基于java的ssm+JSP+MYSQL的九宫格日志网站(含LW+PPT+源码+系统演示视频+安装说明)
  • 每天一道面试题-两数之和
  • SpatialLM尝鲜版
  • JavaEE的知识记录
  • Python第六章03:列表的常用操作
  • 【AI知识】常见的优化器及其原理:梯度下降、动量梯度下降、AdaGrad、RMSProp、Adam、AdamW
  • 线程池学习
  • 如何在Linux中实现scp命令自动输入密码
  • 使用Trae 生成的React版的贪吃蛇
  • 算法刷题记录——LeetCode篇(2) [第101~200题](持续更新)
  • android MutableLiveData setValue 响应速速 postValue 快
  • Collection系列集合的小结+集合并发修改异常问题
  • storeToRefs
  • 【C#】合理使用DeepSeek相关AI应用为我们提供强有力的开发工具,在.net core 6.0框架下使用JsonNode动态解析json字符串,如何正确使用单问号和双问号做好空值处理
  • 基于分类算法的学习失败预警(下)
  • 函数的介绍
  • ​中国超大规模市场是信心所在——海南自贸港建设一线观察
  • 巴基斯坦全面恢复领空开放
  • 工程院院士葛世荣获聘任为江西理工大学校长
  • 图忆|红场阅兵:俄罗斯30年来的卫国战争胜利日阅兵式
  • 治沙“异瞳”男生疑似摆拍,团队称合作12天多期视频为策划拍摄
  • 欧派家居:一季度营收降4.8%,目前海外业务整体体量仍较小