当前位置: 首页 > news >正文

【音频编码格式】AAC详解

文章目录

      • AAC的ADIF和ADTS
      • ADTS结构解析
      • 实际AAC文件分析

AAC的ADIF和ADTS

AAC音频格式:Advanced Audio Coding(高级音频解码),是一种由MPEG-4标准定义的有损音频压缩格式,取代MP3,提供更好的音质和更低的比特率,非常常用!

  • ADIF:Audio Data Interchange Format ADIF是AAC的单一文件存储格式,整个音频流封装为一个文件,适合本地存储(如下载的音频文件);

    • image.png
    • 文件结构:文件头+连续的数据帧
      • [全局头] + [音频数据块1] + [音频数据块2] + … + [音频数据块N]
        • 全局头(Header): 包含采样率、声道数、比特率等全局信息,但不包含帧级的同步信息
      • 音频数据块: 连续存储的AAC压缩数据,没有独立的帧头(与ADTS不同)。
    • 缺点:无法流式传输(需完整文件才能解码)。不能从中间任一帧解码;
    • 应用场景
      • 完整的音频文件(如.m4a、.aac本地文件)
      • 避免ADTS的冗余头开销:ADIF比ADTS节省约5%~10%空间(无每帧头)
  • ADTS(Audio Data Transport Stream) ADTS是AAC的流式传输格式,每帧自带头信息,适合实时传输(如网络直播)

    • image.png
    • 帧结构帧头(7/9字节)+ 数据块:AAC压缩数据。
    • 优势:支持流式播放(可逐帧解析,无需完整文件)
    • 应用场景:- 实时流媒体(HTTP Live Streaming, HLS)。- 广播传输(如数字电视)
    • 问题
      • 编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放?
        • 原始AAC数据(裸流)每一帧因缺少ADTS头信息导致无法被播放器识别image.png
        • 如何为AAC裸流添加ADTS头?
          • 使用FFmpeg封装: 将AAC裸流封装为ADTS格式 ffmpeg -i input_raw.aac -c:a copy -f adts output_adts.aac
  • 二者区别

    • 简单说,ADTS可以在任意帧解码,也就是说它每一帧都有头信息。ADIF只有一个统一的头,所以必须得到所有的数据后解码。
    • 且这两种的header的格式也是不同的,目前一般编码后的和抽取出的都是ADTS格式的音频流。
  • 如何解决ADIF的局限性?

    • 需要流式传输 将ADIF转换为ADTS格式(通过FFmpeg)
        • ffmpeg -i input.adif -f adts output.aac
    • 从ADIF中提取部分数据 必须从头开始截取,否则数据无效:
        • dd if=input.adif of=partial.adif bs=1M count=10 # 截取前10MB

ADTS结构解析

AAC音频文件的每一帧由ADTS Header和AAC Audio Data组成。结构体如下:
image.png
 
 ADTS头解析:每⼀帧的ADTS的头⽂件都包含了⾳频的采样率,声道,帧⻓度等信息,这样解码器才能解析读取。⼀般情况下ADTS的头信息都是7个字节,分为2部分
 1. 固定头(adts_fixed_header):固定头信息中的数据每⼀帧都相 同。28bit=3.5bytes,
 1. image.png
 2. syncword :同步头 总是0xFFF, all bits must be 1,代表着⼀个ADTS帧的开 始
 3. ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2
 4. Layer:always: '00
 5. protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC
 6. profile:表示使⽤哪个级别的AAC,如01 Low Complexity(LC)— AAC LC。有些芯⽚只⽀持AAC LC 。
 1. profile = MPEG-4 Audio Object Type -1
 2. image.png
7. sampling_frequency_index:表示使⽤的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值image.png
8. channel_configuration: 表示声道数,⽐如2表示⽴体声双声道image.png
2. adts_variable_header() 28bit=3.5bytes
1. image.png
2. frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流.
1. frame length, this value must include 7 or 9 bytes of header length:
2. aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
3. protection_absent=0时, header length=9 bytes
4. protection_absent=1时, header length=7bytes
3. adts_buffer_fullness:0x7FF 说明是码率可变的码流。
4. number_of_raw_data_blocks_in_frame:表示ADTS帧中有 number_of_raw_data_blocks_in_frame + 1个AAC原始帧。 所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有⼀个 AAC数据块。

实际AAC文件分析

下⾯是ADTS的AAC⽂件部分:转换为2进制,对应信息就知道了;
image.png

相关文章:

  • 基于vue框架的动漫论坛g2392(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • java加强 -网络编程
  • 自动获取新版本 js 静态文件
  • 嵌入式开发学习日志(linux系统编程--文件读写函数(2))Day25
  • 【5.19-5.26学习周报】
  • 鸿蒙 模块的创建+Video简单使用
  • [Basic] 03.QEMU Task Model 概览
  • 项目时间紧迫的高效应对策略
  • KCTF-遗世独立
  • SpringBoot外部化配置
  • 前端开发遇到 Bug,怎么办?如何利用 AI 高效解决问题
  • 29.第二阶段x64游戏实战-技能冷却
  • 认知计算:迈向人类级智能的 AI 新范式
  • 《易经》的数学表达:初级版和高级版
  • labelme进行关键点标注并转换为yolo格式
  • 模型量化与保存
  • 防火墙高可靠性
  • 支持向量存储:PostgresSQL及pgvector扩展详细安装步骤!老工程接入RAG功能必备!
  • C# AOP编程
  • Elasticsearch常用命令
  • 网站开发分类/seo外包公司报价
  • 网站修改影响做百度竞价吗/如何推销网站