当前位置：首页 > news >正文

【文献阅读】将 CNN 推广到图数据

news 2025/10/29 11:27:25

这篇论文《Learning Convolutional Neural Networks for Graphs》提出了一种名为 Patchy-san（Select-Assemble-Normalize） 的框架，用于将卷积神经网络（CNN） 应用于任意图结构数据，包括有向图、无向图，以及带有离散或连续节点和边属性的图。

🧠 核心思想

传统 CNN 依赖于图像的空间局部性和固定网格结构，而图数据缺乏这种天然的顺序和结构对齐。为此，Patchy-san 通过以下步骤将图“转换”为适合 CNN 输入的形式：

选择节点序列：
使用图标记方法（如节点度、Weisfeiler-Lehman 算法等）对节点排序，从中选出固定数量的节点作为“感受野”的中心。
组装邻域：
对每个选中的节点，通过 BFS 收集其局部邻域，形成一个固定大小的子图。
归一化：
将每个邻域图通过图标记方法映射到一个固定顺序的向量表示，使得结构相似的子图在向量空间中也相似。
输入 CNN：
将归一化后的邻域图作为 CNN 的输入，进行特征学习和分类/回归任务。

🧩 主要贡献

提出了一种通用的图卷积网络框架，不依赖于图的特定结构或节点对齐。

Patchy-san 框架本身是一个特征提取器，它负责将不规则的图数据转换成规整的、适合标准神经网络（如CNN）处理的格式。这个框架的输出（即最终模型的预测结果）可以是以下几种：

1. 图级别输出 - 最常见
这是论文中主要实验的场景。输入是一张完整的图，输出是这张图的一个标签或数值。
任务类型：图分类、图回归
输出示例：
分类（一个标签）：这张分子图是否具有致癌性？（是/否）；这个蛋白质结构是否是酶？（是/否）
回归（一个数值）：预测这个化合物的溶解度；预测这个社交网络的密度。
实现方式：
Patchy-san 从图中提取多个归一化的邻域（ patches）。
这些 patches 经过卷积层、池化层等处理，最终这些信息会被聚合（例如，通过一个全局平均池化层）成一个单一的、固定长度的图级特征向量。
这个图级特征向量被输入到一个全连接层中，最终输出图级别的预测结果。

2. 节点级别输出
输入是一张大图，输出是图中每个节点的标签或数值。
任务类型：节点分类、节点回归
输出示例：
分类：在社交网络中，判断每个用户是“学生”、“工程师”还是“其他”；在引用网络中，判断每篇论文的研究领域。
回归：预测蛋白质结构中每个氨基酸的稳定性得分。
实现方式：
对于图中的每一个节点，Patchy-san 都以其为中心创建一个归一化邻域。
每个邻域经过相同的卷积网络处理，生成一个特征向量来代表该节点的局部结构信息。
每个节点的特征向量被独立地送入一个分类器（如全连接层），为每个节点生成一个预测。最终输出是一个预测序列，长度与节点数相同。

3. 边级别输出
输入是一张大图，输出是图中每对节点之间边的标签或数值。
任务类型：链接预测、边分类
输出示例：
分类/预测：在社交网络中，预测两个人是否会成为朋友；在知识图谱中，预测两个实体之间是否存在某种关系。
实现方式：
这通常更复杂一些。一种常见的方法是：
使用Patchy-san为图中的每个节点生成一个节点嵌入（Node Embedding）。
对于一对节点 (u, v)，将它们的嵌入向量进行某种组合（例如，拼接、点积、或者再通过一个神经网络）。
基于这个组合后的表示，来预测边 (u, v) 的属性或是否存在。

核心思想：Patchy-san 通过提取和归一化局部邻域，将图的结构信息“翻译”成了标准神经网络能够理解的“语言”。至于这个“语言”最终被用来预测什么（整张图、某个节点、还是某条边），则取决于你如何设计输出层。论文的重点是解决了“如何输入” 这个根本性难题，从而使得各种类型的输出成为可能。

定义了图归一化问题，并证明了其 NP 难解性。
提出了一种无监督比较不同图标记方法的方式。
证明了 Patchy-san 在图像数据上可以退化为传统 CNN。
在多个图分类任务上，性能优于或媲美当时最先进的图核方法，且计算效率更高。

🧪 实验结果

在多个图分类基准数据集（如 MUTAG、PROTEINS、D&D 等）上，Patchy-san 与图核方法（如 WL、Graphlet、Shortest-Path 等）相比，准确率相当或更高，且训练速度更快。
可视化学习到的特征表明，模型能捕捉有意义的图结构模式。
方法支持节点和边属性，且适用于大规模图。

🔁 与现有方法的对比

方法类型	特点	缺点
图核方法（Graph Kernels）	基于子结构计数（如路径、图元）	计算复杂度高（通常为 O(N²)），不能学习特征
图神经网络（GNNs）	递归传播节点信息	只能处理离散属性，计算开销大
Patchy-san	局部感受野 + CNN	高效、可扩展、支持连续属性、可学习特征