当前位置: 首页 > news >正文

音视频学习(三十八):像素与位深

像素(Pixel)

  • 定义:图像的最小单元,是一个颜色点。

  • 图像分辨率 = 水平像素数 × 垂直像素数,例如:

    • 1920×1080 表示宽 1920、高 1080,总共约 207 万像素。
  • 每个像素可以包含:

    • 灰度图:一个亮度值(Y)
    • 彩色图:R、G、B(或 Y、Cb、Cr)
    • 有透明度时:还包括 Alpha 通道(A)

位深(Bit Depth)

  • 定义:每个通道用于存储颜色值的位数。

  • 常见位深

    位深每通道色彩等级用途
    8-bit256 等级(2⁸)最常见,视频压缩标准默认
    10-bit1024 等级(2¹⁰)HDR 视频、专业视频处理
    12-bit4096 等级(2¹²)高动态范围、电影制作
    16-bit65536 等级(2¹⁶)医学图像、科学计算等

示例:

  • 8-bit RGB:每个像素使用 8 × 3 = 24 bits(即 3 字节);
  • 10-bit YUV420:Y 用 10 位,U/V 通道也用 10 位,但是按 4:2:0 采样,整体压缩更高。

像素格式(Pixel Format)

在 FFmpeg / 视频编码中,“像素格式” 表示图像的颜色空间 + 位深 + 采样方式

像素格式位深色彩空间采样方式总体说明
yuv420p8-bitYUV4:2:0最常见,8-bit 标清/高清视频
yuv420p10le10-bitYUV4:2:0H.265/ProRes 支持,HDR 视频
rgb248-bitRGB每像素 3 字节,常用于图像处理
gray8-bit灰度单通道,适用于黑白摄像头
yuv422p8-bitYUV4:2:2高清广播、部分相机使用
yuv444p10le10-bitYUV4:4:4无色度压缩,颜色最保真

“le” 表示 little endian(小端序),多见于 x86 平台。

像素与位深的存储空间关系

举例说明:

1920×1080 yuv420p 8bit

  • Y 分量:1920×1080 × 8bit = ~2.07 Mb
  • U 分量:960×540 × 8bit = ~0.26 Mb
  • V 分量:960×540 × 8bit = ~0.26 Mb
  • 总体大小 ≈ 2.6 MB/帧

1920×1080 yuv420p10le

  • 每通道 10bit,用 16bit 对齐存储(占用 2 字节)
  • 总大小 ≈ 2 倍 8-bit,约 5.2 MB/帧

影响

项目影响
编码压缩效率位深越高越难压缩,码率也更高
色彩精度位深越高,颜色过渡越平滑,避免色带(banding)
HDR 支持需要至少 10-bit 才能支持 HDR10、Dolby Vision 等
GPU 加速解码GPU 对特定位深格式支持有限,如 10-bit 需要特定显卡
文件大小位深越高,文件体积越大

YUV与RGB

对比

格式颜色空间采样结构每像素通道数每像素颜色值来源
RGBR, G, B每像素独立 R、G、B3每像素完整色彩值
YUV420Y, U, V4:2:0 色度子采样1(Y)+ 0.25(U)+ 0.25(V)平均每像素有 1.5 通道值

计算方法

RGB24(8-bit RGB,每通道8bit)

每像素:

8bit(R) + 8bit(G) + 8bit(B) = 24 bits = 3 bytes

YUV420P(4:2:0 采样)

每 2×2 像素共用 1 个 U + 1 个 V,Y 每像素都有:

分量分辨率占比
YW × H100%
UW/2 × H/225%
VW/2 × H/225%

合计:

Y:   1 byte × W × H
U: 0.25 byte × W × H
V: 0.25 byte × W × H
总计 ≈ 1.5 byte × W × H

不同位深时存储量对比(以 1920×1080 为例)

格式位深每像素大小总帧大小 ≈
RGB2483 bytes1920×1080×3 = ~5.93 MB
RGB30104 bytes(对齐)1920×1080×4 = ~7.91 MB
YUV420P81.5 bytes1920×1080×1.5 = ~2.96 MB
YUV420P10102 bytes(对齐) × 1.5 = 3 bytes1920×1080×3 = ~5.93 MB

🔸 注意:10-bit 视频通常使用 16-bit 对齐(即每通道 2 字节)存储。

转换影响

从 RGB ➜ YUV420:

  • 颜色有损失,特别是高频色彩细节;
  • 视频压缩比更高,适合编码;
  • 通常用于图像转码、摄像头采集。

从 YUV420 ➜ RGB:

  • 还原近似颜色;
  • 解码时自动完成重建,但不能完全恢复原始 RGB 细节。

总结

属性像素(Pixel)位深(Bit Depth)
含义图像的最小单元每个颜色通道的位数
单位bit(比特)
控制什么图像/视频尺寸每像素能表示的颜色精度
示例1920×10808-bit、10-bit、12-bit
相关术语分辨率、采样率、像素格式色彩深度、HDR、采样位宽
http://www.dtcms.com/a/277299.html

相关文章:

  • 打破并发瓶颈:虚拟线程实现详解与传统线程模型的性能对比
  • QuickUnion优化及Huffman树
  • JS红宝书pdf完整版
  • JAVA生成PDF(itextpdf)
  • 为什么玩游戏用UDP,看网页用TCP?
  • [2025CVPR]GNN-ViTCap:用于病理图像分类与描述模型
  • MyBatis框架进阶指南:深入理解CRUD与参数映射
  • Redis集群方案——哨兵机制
  • 无需付费即可利用AI消除音频噪声和生成字幕
  • 《Linux篇》自动化构建-make/Makefile
  • GraphRAG Docker化部署,接入本地Ollama完整技术指南:从零基础到生产部署的系统性知识体系
  • AI抠图软件,本地运行超快速
  • 水往低处流,人也往低处走
  • 三种网络类型
  • 跨域中间件通俗理解
  • 教程:如何查看浏览器扩展程序的源码
  • Linux驱动11 --- buildroot杂项驱动开发方法
  • 网络资源模板--基于Android Studio 实现的音乐播放器App
  • 【Go语言-Day 19】深入理解Go自定义类型:Type、Struct、嵌套与构造函数实战
  • 系规备考论文:论IT服务知识管理
  • 20250711_Sudo 靶机复盘
  • vue的优缺点
  • React强大且灵活hooks库——ahooks入门实践之状态管理类hook(state)详解
  • 在NDK开发中如何正确创建JNI方法
  • Perl小骆驼学习笔记 - 9. 用正则表达式处理文本
  • 香港服务器Python自动化巡检脚本开发与邮件告警集成
  • 《雨下小暑》诗赏——小暑时节暴雨之晨的清凉视听(智普清言)
  • iOS UI视图面试相关
  • 从儿童涂鸦到想象力视频:AI如何重塑“亲子创作”市场?
  • [特殊字符]使用 Nginx 将 HTTP 重定向到 HTTPS