Pixels(像素)
“Pixels(像素)” 是图像世界中最基础的单位。
无论是你看到的一张照片、一帧视频,还是计算机处理的图像矩阵,
它们本质上都是由像素(pixel)组成的。
我们从直觉、数学、在计算机中的表示三个角度讲清楚👇
🧩 一、什么是 Pixel(像素)
Pixel(picture element)= 图像的最小单位。
一张数字图像可以看作一个由许多小方格组成的网格,
每个小方格都有自己的颜色值——那就是一个 像素。
🧮 二、像素在计算机中的表示
图像在计算机中通常是一个 二维矩阵(或三维张量)。
1️⃣ 灰度图(Grayscale image)
每个像素用一个数表示亮度
(0 表示黑色,255 表示白色)
例如 3×3 灰度图:
2️⃣ 彩色图(RGB image)
每个像素由 三个通道(channels) 组成:
R:红色强度
G:绿色强度
B:蓝色强度
每个通道的取值范围一般是 0–255。
例如:
# 一个像素的 RGB 值
pixel = [120, 200, 150] # [R, G, B]
整张图就是一个三维数组:
在 PyTorch / TensorFlow 中通常表示为:
image_tensor.shape = (3, H, W)
🎨 三、像素与分辨率(Resolution)
图像的“清晰度”由像素数量决定:
分辨率 | 像素数量 | 举例 |
---|---|---|
640×480 | 307,200 像素 | 老式显示器 |
1920×1080 | ≈200 万像素(2MP) | 全高清 |
3840×2160 | ≈830 万像素(4K) | 高清电视 |
分辨率 = 宽 × 高 = 像素总数。
🔍 四、像素与深度学习的关系
在深度学习(尤其是图像任务)中:
模型的输入通常是像素矩阵。
卷积神经网络(CNN)就是在像素上滑动卷积核来提取特征。
ViT(Vision Transformer)会先把图像切成 patch(小块),每个 patch 就是一组像素的向量表示。
例如:
import torch
img = torch.randn(3, 224, 224) # 一张彩色图像(3个通道)
这里的 224×224 = 50176 个像素,每个像素包含 3 个通道。
💡 五、像素的关键特性总结
特性 | 说明 |
---|---|
最小单位 | 构成图像的最小方格 |
位置性 | 每个像素有 (x, y) 坐标 |
颜色值 | 灰度图是单值,彩色图是多通道(RGB) |
离散性 | 数字图像是离散像素矩阵的集合 |
连续表示 | 在神经网络中会被归一化为 0–1 浮点数输入模型 |
✅ 六、一句话总结
像素(pixel)是数字图像的最小组成单位,
每个像素携带颜色或亮度信息,
所有像素组成了图像矩阵,是视觉模型的输入基础。