卷积运算是如何进行的?
一、首先讲一下,RGB图像的显色原理
1. 像素的组成
在RGB图像中,每个像素由三个通道组成,分别对应红(R)、绿(G)和蓝(B)三种颜色。每个通道的值通常是一个介于0到255之间的整数(对于8位图像),表示该颜色通道的强度。
例如,一个像素的RGB值可以表示为:
Pixel=(R,G,B)=(255,0,0)
这个像素表示纯红色,因为红色通道的值为255,而绿色和蓝色通道的值为0。
2. 加色混合
RGB图像的显色原理基于加色混合,即通过将红、绿、蓝三种颜色的光以不同的强度组合在一起,形成各种颜色。具体来说:
-
红色通道:表示红色光的强度。
-
绿色通道:表示绿色光的强度。
-
蓝色通道:表示蓝色光的强度。
当这三个通道的光在显示设备(如显示器或电视)上叠加时,人眼会感知到最终的颜色。例如:
-
白色:当三个通道的值都为255时,即 (255,255,255),人眼会感知到白色。
-
黑色:当三个通道的值都为0时,即 (0,0,0),人眼会感知到黑色。
-
灰色:当三个通道的值相等但不为0或255时,例如 (128,128,128),人眼会感知到灰色。
-
其他颜色:通过不同强度的红、绿、蓝光组合,可以形成各种颜色。
3. 像素点的叠加
在显示设备上,每个像素的RGB值决定了该像素的颜色。显示设备(如LCD或LED显示器)通过控制每个像素的红、绿、蓝子像素的亮度来显示最终的颜色。具体来说:
-
红子像素:控制红色光的亮度。
-
绿子像素:控制绿色光的亮度。
-
蓝子像素:控制蓝色光的亮度。
这三个子像素的光在人眼视网膜上混合,形成最终的颜色。例如:
-
纯红色:红子像素亮度为最大值,绿子像素和蓝子像素亮度为0。
-
纯绿色:绿子像素亮度为最大值,红子像素和蓝子像素亮度为0。
-
纯蓝色:蓝子像素亮度为最大值,红子像素和绿子像素亮度为0。
-
黄色:红子像素和绿子像素亮度为最大值,蓝子像素亮度为0。
示例
假设一个像素的RGB值为 (255,255,0),表示黄色。在显示设备上,这个像素的红子像素和绿子像素会发出最大亮度的光,而蓝子像素不发光。人眼会感知到红色光和绿色光的混合,最终看到黄色。
总结
原始图像也是由像素组成的,每个像素包含三个通道(红、绿、蓝)。RGB图像的显色原理基于加色混合,通过将红、绿、蓝三种颜色的光以不同的强度组合在一起,形成各种颜色。每个像素的RGB值决定了该像素的颜色,显示设备通过控制每个像素的红、绿、蓝子像素的亮度来显示最终的颜色。
二、特征图与输入图像的概念
特征图(Feature Map) 是卷积神经网络(CNN)中卷积层输出的结果。它是由卷积核在输入图像上滑动并进行卷积运算后生成的二维或三维数组。特征图中的每个元素(或“像素”)表示卷积核在输入图像的某个局部区域上的响应强度。因此,特征图反映了输入图像在特定卷积核定义的特征上的响应。
特征图的生成过程
-
输入图像:可以是原始图像,也可以是前一层卷积层的输出。
-
卷积核(滤波器):卷积核在输入图像上滑动,对每个局部区域进行点积运算。
-
卷积运算:卷积核与输入图像的局部区域进行点积运算,生成一个标量值。
-
输出特征图:所有点积运算的结果组成一个特征图。如果有多个卷积核,每个卷积核生成一个特征图,最终形成一个三维张量。
单通道图像与特征图的区别
-
单通道图像:单通道图像(如灰度图像)是一个二维数组,每个像素值表示图像在该位置的亮度或强度。单通道图像本身不是特征图,而是卷积运算的输入。
-
特征图:特征图是卷积运算的结果,它反映了输入图像在特定卷积核定义的特征上的响应。特征图中的每个像素值表示卷积核在输入图像的局部区域上的响应强度。
三、灰度图与RGB图
1. 颜色表示
-
灰度图:
-
灰度图是一种单通道图像,每个像素只有一个亮度值,表示该像素的灰度强度。
-
灰度值通常是一个介于0到255之间的整数(对于8位图像),其中0表示黑色,255表示白色,中间值表示不同灰度级别的颜色。
-
灰度图不包含颜色信息,只表示图像的亮度分布。
-
-
RGB图:
-
RGB图是一种三通道图像,每个像素包含三个颜色通道:红(R)、绿(G)和蓝(B)。
-
每个通道的值也是一个介于0到255之间的整数(对于8位图像),表示该颜色通道的强度。
-
通过将红、绿、蓝三种颜色的光以不同的强度组合在一起,可以形成各种颜色。RGB图能够表示丰富的颜色信息。
-
2. 数据结构
-
灰度图:
-
灰度图的数据结构是一个二维数组,形状为
(height, width)
。 -
每个元素表示一个像素的灰度值。
-
-
RGB图:
-
RGB图的数据结构是一个三维数组,形状为
(height, width, 3)
。 -
每个像素由三个通道的值组成,分别表示红、绿、蓝三种颜色的强度。
-
-----
RGB图像的卷积过程如下: