当前位置: 首页 > news >正文

【文献阅读】将 CNN 推广到图数据

这篇论文《Learning Convolutional Neural Networks for Graphs》提出了一种名为 Patchy-san(Select-Assemble-Normalize) 的框架,用于将卷积神经网络(CNN) 应用于任意图结构数据,包括有向图、无向图,以及带有离散或连续节点和边属性的图。


🧠 核心思想

传统 CNN 依赖于图像的空间局部性固定网格结构,而图数据缺乏这种天然的顺序和结构对齐。为此,Patchy-san 通过以下步骤将图“转换”为适合 CNN 输入的形式:

  1. 选择节点序列
    使用图标记方法(如节点度、Weisfeiler-Lehman 算法等)对节点排序,从中选出固定数量的节点作为“感受野”的中心。

  2. 组装邻域
    对每个选中的节点,通过 BFS 收集其局部邻域,形成一个固定大小的子图。

  3. 归一化
    将每个邻域图通过图标记方法映射到一个固定顺序的向量表示,使得结构相似的子图在向量空间中也相似。

  4. 输入 CNN
    将归一化后的邻域图作为 CNN 的输入,进行特征学习和分类/回归任务。


🧩 主要贡献

  • 提出了一种通用的图卷积网络框架,不依赖于图的特定结构或节点对齐。

Patchy-san 框架本身是一个特征提取器,它负责将不规则的图数据转换成规整的、适合标准神经网络(如CNN)处理的格式。这个框架的输出(即最终模型的预测结果)可以是以下几种:


1. 图级别输出 - 最常见

这是论文中主要实验的场景。输入是一张完整的图,输出是这张图的一个标签或数值。

  • 任务类型:图分类、图回归

  • 输出示例

    • 分类(一个标签):这张分子图是否具有致癌性?(是/否);这个蛋白质结构是否是酶?(是/否)

    • 回归(一个数值):预测这个化合物的溶解度;预测这个社交网络的密度。

实现方式

  1. Patchy-san 从图中提取多个归一化的邻域( patches)。

  2. 这些 patches 经过卷积层、池化层等处理,最终这些信息会被聚合(例如,通过一个全局平均池化层)成一个单一的、固定长度的图级特征向量

  3. 这个图级特征向量被输入到一个全连接层中,最终输出图级别的预测结果。


2. 节点级别输出

输入是一张大图,输出是图中每个节点的标签或数值。

  • 任务类型:节点分类、节点回归

  • 输出示例

    • 分类:在社交网络中,判断每个用户是“学生”、“工程师”还是“其他”;在引用网络中,判断每篇论文的研究领域。

    • 回归:预测蛋白质结构中每个氨基酸的稳定性得分。

实现方式

  1. 对于图中的每一个节点,Patchy-san 都以其为中心创建一个归一化邻域。

  2. 每个邻域经过相同的卷积网络处理,生成一个特征向量来代表该节点的局部结构信息。

  3. 每个节点的特征向量被独立地送入一个分类器(如全连接层),为每个节点生成一个预测。最终输出是一个预测序列,长度与节点数相同。


3. 边级别输出

输入是一张大图,输出是图中每对节点之间边的标签或数值。

  • 任务类型:链接预测、边分类

  • 输出示例

    • 分类/预测:在社交网络中,预测两个人是否会成为朋友;在知识图谱中,预测两个实体之间是否存在某种关系。

实现方式
这通常更复杂一些。一种常见的方法是:

  1. 使用Patchy-san为图中的每个节点生成一个节点嵌入(Node Embedding)。

  2. 对于一对节点 (u, v),将它们的嵌入向量进行某种组合(例如,拼接、点积、或者再通过一个神经网络)。

  3. 基于这个组合后的表示,来预测边 (u, v) 的属性或是否存在。


核心思想:Patchy-san 通过提取和归一化局部邻域,将图的结构信息“翻译”成了标准神经网络能够理解的“语言”。至于这个“语言”最终被用来预测什么(整张图、某个节点、还是某条边),则取决于你如何设计输出层。论文的重点是解决了“如何输入” 这个根本性难题,从而使得各种类型的输出成为可能。

  • 定义了图归一化问题,并证明了其 NP 难解性。

  • 提出了一种无监督比较不同图标记方法的方式。

  • 证明了 Patchy-san 在图像数据上可以退化为传统 CNN。

  • 在多个图分类任务上,性能优于或媲美当时最先进的图核方法,且计算效率更高


🧪 实验结果

  • 在多个图分类基准数据集(如 MUTAG、PROTEINS、D&D 等)上,Patchy-san 与图核方法(如 WL、Graphlet、Shortest-Path 等)相比,准确率相当或更高,且训练速度更快

  • 可视化学习到的特征表明,模型能捕捉有意义的图结构模式。

  • 方法支持节点和边属性,且适用于大规模图。


🔁 与现有方法的对比

方法类型特点缺点
图核方法(Graph Kernels)基于子结构计数(如路径、图元)计算复杂度高(通常为 O(N²)),不能学习特征
图神经网络(GNNs)递归传播节点信息只能处理离散属性,计算开销大
Patchy-san局部感受野 + CNN高效、可扩展、支持连续属性、可学习特征

✅ 总结

Patchy-san 是一种将 CNN 推广到图数据的有效方法,通过局部邻域提取 + 图归一化 解决了图结构无序和非对齐的问题,在多个任务上表现出色,为图深度学习提供了一个通用且高效的框架。

http://www.dtcms.com/a/541592.html

相关文章:

  • 向国外支付网站开发费线上营销图片
  • 电商或游戏平台基于大数据引入AI智能体
  • 网站建设注意哪些西安网站建设制作公司
  • Kotlin 协程实践:深入理解 SupervisorJob、CoroutineScope、Dispatcher 与取消机制
  • 机械革命 GM7ZG7m 蛟龙7 5900HX 黑苹果 EFI
  • 怎样自己建设网站企查查企业信息查询系统官网
  • 介绍Spring Cloud Gateway
  • 成都自适应网站建设域名主机网站导航
  • 【数据结构】队列(Queue)详解——数据结构的“先进先出”
  • 【操作系统】计算机系统概述
  • 为什么Android游戏画面在30帧运行时有抖动现象
  • 做的好的手机网站建设银行官方网站认证
  • 云南建设厅网站备案厂家域名审核怎么做返利网站
  • docker compose配置容器只允许指定的外部IP访问
  • 【postgresql在sql的基础上将frvcd按照逗号分割,核查两个表中frvcd数量是否相同】
  • 考研政治(马原)
  • 电商网站开发工作室商务网站模板
  • 金融交易防护:国密 SSL 证书在网银与移动支付中的核心作用
  • 织梦图片瀑布流网站模板摄影作品发布平台
  • spark-RDD期中
  • Linux 网络初识
  • 易天光通信光模块认证全解析:构建全球品质信任网络
  • 计算机网络自顶向下方法12——应用层 对HTTP响应报文优先次序的答疑
  • 上海企业建设网站服务网站的首页标题在哪里设置的
  • 城市建设规划网站无锡网站建设f7wl
  • 算法题 逆波兰表达式/计算器
  • 智能体最佳实践的方法论(四):监控
  • 【java面向对象进阶】------内部类
  • 基于昇腾 NPU 的 Gemma 2 推理实测:性能评测、脚本实现与可视化分析
  • 南京设计公司郑州粒米seo顾问