当前位置：首页 > news >正文

论文解读：《DeepGray：基于灰度图像和深度学习的恶意软件分类方法》

news 2025/7/5 17:54:21

开篇

今天继续来学习网络安全领域的优秀论文，多了解一些创新的方法，旨在开阔眼界和思路。这次要解读的论文属于二进制恶意样本分类领域，二进制检测和分类是一个长久的话题了，业界使用的方法也多种多样，传统方法比如签名、沙箱等。但是传统检测方法往往难以跟上不断变异和混淆的恶意软件的步伐，所以越来越多的研究开始转向能有效进行恶意软件分析和分类的深度学习方法。

这篇论文提出的方法非常新颖，值得深入学习一下。总的来说，该论文提出了一种名为DeepGrey的新方法，该方法将二进制样本转换为灰度图像，保留关键数据特征，然后基于计算机视觉的深度学习模型通过图像分类的方式，来实现二进制样本的分类。

好的，接下来我们就来详细分析下这个方法。

灰度图

先来简单科普下什么是灰度图。

灰度图（Gray Scale Image）是数字图像处理中的一种基础形式，其核心特征是仅保留图像的亮度信息，而舍弃颜色信息。
在这里插入图片描述

灰度图有如下特点：

1.单通道表示：灰度图中每个像素仅包含一个值（即灰度值），范围通常为 0（纯黑）到255（纯白），中间值代表不同深浅的灰色（如128为中灰）；

与彩色图像（RGB三通道）不同，灰度图通过单一通道简化了数据维度。
与二值图像（仅黑白两色）不同，灰度图具有256级（8位）或更高（如16位65536级）的连续灰度层次

2.视觉表现：灰度图以黑白灰的渐变呈现图像内容，例如黑白照片本质是灰度图的一种应用形式；

使用灰度图有如下的优势：
简化计算与存储

单通道数据量仅为彩色图像的1/3，提升处理效率（如边缘检测、图像分割）
节省存储空间和传输带宽，适用于实时处理系统（如视频监控）

突出结构与纹理
去除颜色干扰后，图像中的形状、边缘和亮度变化更易识别，适用于：

医学影像（X光、MRI病灶分析）
工业检测（零件表面缺陷识别）
遥感图像（地形灰度量化分析）

算法兼容性
多数传统图像处理算法默认针对灰度数据设计的。

二进制样本->灰度图像

好的，那怎么将一个二进制样本文件转换为灰度图呢？
在这里插入图片描述

首先，将二进制文件的所有内容按二进制连续8位（1字节）为单位读取，每个字节转换为一个无符号整数（范围0-255，对应灰度图中的一个像素）。
比如，二进制流 00111010 01010010… → 转换为一维整数向量 [58, 82, …]。

然后，将一维整数向量重组为二阶矩阵（高度与宽度相同的二阶方阵），如果一维整数向量长度不足以构成二阶方阵，则使用0来填充，直到该向量能形成最小2阶方阵。
比如一维向量[58,82,45,67,12,90,88]，转换成的二阶方阵为：
[ [58,82,45], [67,12,90], [88,0,0] # 这里使用0来填充 ]

最后，因为不同大小的样本构成的二阶方阵的宽度是不同的，而深度学习模型（如VGG16、ViT）要求固定输入尺寸，因此需要对原灰度图进行降维处理，统一降维压缩到512X512的固定尺寸。

降维采用了两种方法：