当前位置: 首页 > news >正文

android 媒体框架之MediaCodec

一、MediaCodec 整体架构与设计思想

MediaCodec 是 Android 底层多媒体框架的核心组件,负责高效处理音视频编解码任务。其架构采用 生产者-消费者模型,通过双缓冲区队列(输入/输出)实现异步数据处理:

  • 输入缓冲区队列:存放待编码/解码的原始数据(如 YUV 视频帧或 PCM 音频)。
  • 输出缓冲区队列:存储处理后的数据(如 H.264 流或解码后的原始帧)。
  • 硬件加速支持:优先调用设备专属编解码器(如高通 DSP),显著降低 CPU 负载。

二、核心组件与关键 API 详解

1. 编解码器实例(MediaCodec)
  • 创建方式
    // 创建解码器(H.264 示例)
    MediaCodec decoder = MediaCodec.createDecoderByType("video/avc");
    // 创建编码器(AAC 音频示例)
    MediaCodec encoder = MediaCodec.createEncoderByType("audio/mp4a-latm");
    
    支持通过 MIME 类型(如 video/avc)或硬件编解码器名称创建。
2. 缓冲区管理
  • 输入缓冲区
    • dequeueInputBuffer(timeoutUs):获取空闲缓冲区索引。
    • getInputBuffer(index):通过索引获取 ByteBuffer 对象填充数据。
    • queueInputBuffer(...):提交数据给编解码器处理。
  • 输出缓冲区
    • dequeueOutputBuffer(BufferInfo, timeoutUs):获取处理完成的缓冲区索引及元数据。
    • getOutputBuffer(index):读取编解码后数据。
    • releaseOutputBuffer(index, render):释放缓冲区(若为视频,render=true 可触发渲染)。
3. 配置与状态控制
  • 配置参数(MediaFormat)
    MediaFormat format = MediaFormat.createVideoFormat("video/avc", width, height);
    format.setInteger(MediaFormat.KEY_BIT_RATE, 5000000);  // 码率
    format.setInteger(MediaFormat.KEY_FRAME_RATE, 30);     // 帧率
    format.setInteger(KEY_COLOR_FORMAT, COLOR_FormatYUV420Flexible); // 颜色空间
    codec.configure(format, surface, null, 0); // surface 用于视频渲染
    
  • 生命周期控制
    • start() → 进入运行状态(Running)。
    • stop() → 回到未初始化状态(Uninitialized)。
    • release() → 释放资源。

三、核心类 MediaCodec.BufferInfo 深度解析

BufferInfo 是描述输出缓冲区元数据的关键类,包含以下字段:

字段类型作用
offsetint有效数据在缓冲区中的起始偏移(字节)。通常为 0,表示从缓冲区头部开始读取。
sizeint有效数据长度(字节)。若为 0 且含 BUFFER_FLAG_END_OF_STREAM,表示流结束。
presentationTimeUslong呈现时间戳(微秒),用于音视频同步(如视频帧的渲染时机)。
flagsint缓冲区标志位(位掩码),关键值包括:
(0) : B or P 帧
- BUFFER_FLAG_KEY_FRAME(1):关键帧(I帧)。
- BUFFER_FLAG_END_OF_STREAM(4):流结束标记(EOS)。
- BUFFER_FLAG_CODEC_CONFIG(2):编解码配置数据(如 SPS/PPS)。

典型使用场景

MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
int outputIndex = codec.dequeueOutputBuffer(bufferInfo, timeoutUs);
if (outputIndex >= 0) {ByteBuffer outputBuffer = codec.getOutputBuffer(outputIndex);byte[] data = new byte[bufferInfo.size];outputBuffer.position(bufferInfo.offset);outputBuffer.get(data, 0, bufferInfo.size);// 关键帧处理if ((bufferInfo.flags & MediaCodec.BUFFER_FLAG_KEY_FRAME) != 0) {saveKeyFrame(data); // 存储关键帧用于错误恢复}codec.releaseOutputBuffer(outputIndex, true);
}

四、工作流程与状态机

请添加图片描述

  • 关键状态
    • Flushed:启动后初始状态,缓冲区为空。
    • Running:持续处理数据(90% 时间处于此状态)。
    • End-of-Stream:输入流结束,等待输出剩余数据。

五、注意

  1. 同步 vs 异步模式

    • 同步模式:简单但易阻塞主线程,适合低复杂度场景。
    • 异步模式:通过 setCallback() 监听事件,高效但需处理线程安全。
  2. 缓冲区复用:避免频繁申请内存,提升性能(尤其高清视频)。

  3. 设备兼容性

    • 使用 MediaCodecList 检查编解码器支持情况。
    • 某些设备对 COLOR_FORMAT 支持有限,需动态适配。
  4. MediaCodec 通过双缓冲区队列状态机控制实现高效编解码,核心在于:
    缓冲区管理:dequeueInputBuffer/queueInputBufferdequeueOutputBuffer/releaseOutputBuffer 的配对使用。

  5. 元数据解析:BufferInfoflagspresentationTimeUs 是同步与错误恢复的关键。

  6. 硬件加速:优先选择设备专属编解码器(如 OMX.qcom. 前缀)以优化性能。

相关文章:

  • leetcode hot100刷题日记——31.二叉树的直径
  • [GHCTF 2025]SQL???
  • leetcode hot100刷题日记——32.杨辉三角
  • CppCon 2014 学习: The Implementation of Value Types
  • 深入理解 Java 中的 Unsafe 类:原理、应用与风险
  • Java并发编程实战 Day 1:Java并发编程基础与线程模型
  • [SLAM自救笔记0]:开端
  • 字符串索引、幻读的解决方法
  • 玩客云WS1608控制LED灯的颜色
  • RLHF奖励模型的训练
  • 【Qt】EventFilter,要增加事件拦截器才能拦截到事件
  • 数据库只更新特定字段的两种方式(先读后写 vs. 动态组织 SQL)-golang SQLx 实现代码(动态组织 SQL)
  • 【设计模式-4.6】行为型——状态模式
  • 电路学习(二)之电容
  • Win10 doccano pip安装笔记
  • 【深度学习】16. Deep Generative Models:生成对抗网络(GAN)
  • STM32CubeMX串口配置
  • LeetCode[257]二叉树的所有路径
  • 【图像处理入门】3. 几何变换基础:从平移旋转到插值魔法
  • 基于开源AI大模型AI智能名片S2B2C商城小程序源码的销售环节数字化实现路径研究
  • h5商城网站是什么/南宁网络推广热线
  • 北京P2P公司网站建设/收录优美图片官网
  • 住房和城乡建设部网站现行规范/个人做seo怎么赚钱
  • 政府网站建设成本/广州最近爆发什么病毒
  • 做vi网站/苏州网站外包
  • 有个新网站专门做外贸的叫什么/个人网站制作软件