当前位置: 首页 > news >正文

2025-ICML-Enhancing Spectral GNNs: From Topology and Perturbation Perspectives

Information

  1. Authors: Taoyang Qin, Ke-Jia CHEN, Zheng Liu
  2. Affiliations: Nanjing University of Posts and Telecommunications

Abstract

  1. 针对问题:图中存在重复的特征值,限制谱域GNN的能力
  2. 解决: 高维 sheaf Laplacian Matrix——对图的拓扑信息进行编码,同时提高不同特征值数量的上界
    • Sheaf Laplacian Matrix 由 Normalized Graph Laplacian 的 block form 进行扰动获取
    • 理论分析了添加 Pertubed Sheaf Laplacian(PSL) 之后的谱域 GNN 的表达能力
    • 确立了特征值的 perturbation bounds
    • 基于节点分类任务测试了模型能力

1. Introduction

  1. 此前工作多在设计线性变化解决特征值重复的问题,本文从 non-linear 的情景出发

2. Preliminaries

2.1 Spectral GNNs

在这里插入图片描述
φ\varphiφ 为线性/非线性函数,对应的 GNN 也相应被称为 线性/非线性 spectral GNNs

2.2 Theory of Cellular Sheaves

Definition 2.1

无向图 G=(V,E)G=(V,E)G=(V,E) 上的 cellular sheaf (G,F)(G, \mathcal{F})(G,F)定义为:

  1. 向量空间 F(v)\mathcal{F}(v)F(v): 对应每个节点
  2. 向量空间 F(e)\mathcal{F}(e)F(e): 对应每条边
  3. 线性映射 向量空间 Fv⊴e\mathcal{F}_{v \unlhd e}Fve:对应每个邻接的节点-边对 v⊴ev\unlhd eve,将 F(v)\mathcal{F}(v)F(v) 的向量映射到 F(e)\mathcal{F}(e)F(e)

节点和边对应的向量空间称为 stalks,线性映射称为 restriction maps,这里令所有的stalks均为Rd\mathbb{R}^dRd,restricion maps 均为正交映射; Fv⊴e\mathcal{F}_{v \unlhd e}FveFv⊴eT\mathcal{F}_{v \unlhd e}^TFveT 分别表示从 node/edge stalk 到 edge/node stalk 的映射,则有 Fu⊴(v,u)TFv⊴(v,u)\mathcal{F}_{u \unlhd (v,u)}^T\mathcal{F}_{v \unlhd (v,u)}Fu(v,u)TFv(v,u)表示从 Fv\mathcal{F}_{v}FvFu\mathcal{F}_{u}Fu 的映射

Definition 2.2

无向图 GGG 上的单个 sheaf 对应的 sheaf Laplacian matrix 是一个块矩阵 LF\mathcal{L}_{\mathcal{F}}LF

  1. 对角块为 LF,vv=∑v⊴eFv⊴eTFv⊴e\mathcal{L}_{\mathcal{F},vv} = \sum_{v\unlhd e} \mathcal{F}_{v \unlhd e}^T\mathcal{F}_{v \unlhd e}LF,vv=veFveTFve
  2. 非对角块为 LF,vu=−Fv⊴eTFu⊴e\mathcal{L}_{\mathcal{F},vu} =- \mathcal{F}_{v \unlhd e}^T\mathcal{F}_{u \unlhd e}LF,vu=FveTFue

半正定矩阵,当 restriction maps 为 identity maps 时, sheaf Laplacian Matrix 即为 graph Laplacian matrix 的块形式

Definition 2.3

sheaf Laplacian matrxi 的 normalized form 为 LF‾=D−1/2LFD−1/2,Dv=LF,vv\overline{\mathcal{L}_{\mathcal{F}}}=D^{-1/2}\mathcal{L}_{\mathcal{F}}D^{-1/2}, D_v=\mathcal{L}_{\mathcal{F},vv}LF=D1/2LFD1/2,Dv=LF,vv ,sheaf Laplacian matrix 的对角阵为 D=diag(D1,...,Dn)D=diag(D_1,...,D_n)D=diag(D1,...,Dn)

3. Motivation

3.1 Limited Predictive Ability

Lemma 3.1.

若图拉普拉斯矩阵只有 kkk 个不同的特征值,线性谱域GNNs最多只能生成 kkk 个不同的 filter coefficients,因此最多只能生成最多 kkk 个不同元素的一维预测结果

Theorem 3.2.

若图拉普拉斯矩阵只有 kkk 个不同的特征值,若非线性实值函数 σ\sigmaσ 满足 x≠0x \neq 0x=0σ(x)≠0\sigma(x)\neq 0σ(x)=0,那么非线性谱域 GNNs最多只能生成 kkk 个不同的 filter coefficients,因此最多只能生成最多 kkk 个不同元素的一维预测结果

即便添加了非线性的激活函数,仍然无法提升预测能力

3.2 Loss of Frequency Components

若特征值存在重复,且对应的 filter function g(λ)g(\lambda)g(λ) 选取不佳的话,会将某些特征值对应的值设为0,造成对应的多个频率信号一起丢失

一个小例子:很多数据集中均会出现特征值 1 的重复,因此使用 GCN (g(λ)=1−λg(\lambda)=1-\lambdag(λ)=1λ)时,如果不添加 self-loop,效果会差很多,添加之后特征值分布发生变化,丢失的 frequency component 会减少,进而提升模型表现

3.3 Restricted Frequency Processing Capability

重复的特征值会导致谱域 GNNs 的 g(λi)g(\lambda_i)g(λi)出现重复,因此对不同的 Xi^\hat{X_i}Xi^ 和 $\hat{X_j} $的处理也会变得一样,缺乏区分性

3.4 Why Perturbed Sheaf Laplacian

Sheaf Laplacian:提供更大的特征值取值范围,仍然保持半正定且在 [0,2] 区间内

Pertubed Sheaf Laplacian(PSL):

  1. restriction map 设为 identity matrix 的轻微修改
  2. 提高特征值的多样性
  3. 更接近图拉普拉斯矩阵,保留拓扑结构信息

4. Method在这里插入图片描述

4.1 Preprocessing of Graph Data

将初始输入的图 X0∈Rn×f1X_0\in \mathbb{R}^{n\times f_1}X0Rn×f1 转换成 sheaf Laplacian matrix LF‾∈Rnd×nd\overline{\mathcal{L}_{\mathcal{F}}} \in \mathbb{R}^{nd\times nd}LFRnd×nd:
在这里插入图片描述

4.2 Construction of Perturbed Sheaf Laplacian

当restriction map不是 identity map 时,LF‾\overline{\mathcal{L}_{\mathcal{F}}}LF 可视为对块形式的图拉普拉斯矩阵进行扰动之后的结果,对于每一个块 Lblock,ij\mathcal{L}_{block,ij}Lblock,ij,施加相应的扰动矩阵 Qij=Fi⊴eTFj⊴eQ_{ij}=\mathcal{F}_{i \unlhd e}^T\mathcal{F}_{j \unlhd e}Qij=FieTFje 即可得到 LF‾\overline{\mathcal{L}_{\mathcal{F}}}LF

Theorem 4.1

P=LF‾−LblockP=\overline{\mathcal{L}_{\mathcal{F}}} - \mathcal{L}_{block}P=LFLblockLblock\mathcal{L}_{block}Lblock对应的 perturbation matrix,ϕ=min⁡i,j;i≠j∣λi−λj∣,λi\phi = \min_{i,j;i\neq j}|\lambda_i - \lambda_j|,\lambda_iϕ=mini,j;i=jλiλj,λiLblock\mathcal{L}_{block}Lblock的特征值。则有,若 ∣∣P∣∣2<ϕ2||P||_2 < \frac{\phi}{2}∣∣P2<2ϕ,则特征值的重复度会下降

也就是说,扰动只应当设的小一点,这里设为 Fi⊴(i,j)=I−2uijuijT∣∣uij∣∣2\mathcal{F}_{i\unlhd (i,j)} = I-2\frac{u_{ij}u_{ij}^T}{||u_{ij}||^2}Fi(i,j)=I2∣∣uij2uijuijT——Householder变换,uiju_{ij}uij范围为 [η/10,η],η[\eta/10, \eta], \eta[η/10,η],η 为足够小的值

4.3 PSL-GNN: Perturbed Sheaf Laplacian-Based GNN

理论上来讲,本方法可以与任意谱域GNN结合,这里以 GCN和 GPRGNN为例

4.3.1 PSL-GCN

即将 g(Δ)=I−Δg(\Delta) = I-\Deltag(Δ)=IΔ 改为 g(ΔF)=I−ΔFg(\Delta_{\mathcal{F}}) = I-\Delta_{\mathcal{F}}g(ΔF)=IΔF
最后一层处理完后添加 reshape 模块:在这里插入图片描述

4.3.2 PSL-GPR

GPRGNN: Z=∑k=0Kαk(I−L)kX0Z=\sum_{k=0}^K \alpha_k(I-\mathcal{L})^kX_0Z=k=0Kαk(IL)kX0
PSL-GPR: Y=∑k=0Kαk(I−LF‾)kXY=\sum_{k=0}^K \alpha_k(I-\overline{\mathcal{L}_{\mathcal{F}}})^kXY=k=0Kαk(ILF)kX
同样经过 reshape 和映射得到最终结果:在这里插入图片描述

5. Theoretical Analysis

5.1 Expressiveness of PSL-GNN

Proposition 5.1

Lblock=L⊗I∈Rnd×nd\mathcal{L}_{block} = \mathcal{L}\otimes I \in \mathbb{R}^{nd\times nd}Lblock=LIRnd×nd 的不同特征值数量和 L\mathcal{L}L相同,对应的GNN的能力也相同

Corollary 5.2-5.4

PSL-GNN 有更强的一维预测能力/丢失的频率信息更少/处理 frequency components 的能力更强

5.2 Perturbation Bounds of Eigenvalues

在这里插入图片描述perturbation 越小,特征值的变化也就越小,对于原图的结构信息的保持越好

6. Experiment

6.1 Evaluation on Real-World Datasets

1, Metrics:
- VAG(Vertical Average Gain)在这里插入图片描述
- HAG(Horizontal Average Gain)在这里插入图片描述
在这里插入图片描述

6.2 Ablation Study

Perturbed Sheaf Laplacian Matrix vs. General Sheaf Laplacian Matrix(GSL:不做任何限制地在整个正交空间里生成) vs. Normalized Graph Laplacian Matrix在这里插入图片描述
PSL-GNN 和 GSL-GNN的表现相当,说明二者学习到的结构趋于一致

6.3 The Number of Distinct Eigenvalues在这里插入图片描述

Pubmed 使用PSL之后的特征值数目仍然很少啊,但是效果竟然还可以

http://www.dtcms.com/a/506748.html

相关文章:

  • Mac版PDF Squeezer v4.5.1安装教程(DMG文件下载+详细步骤)​
  • PDF处理控件Aspose.PDF教程:在C#中将PDF转换为Base64
  • 《恋爱先生》电视剧总结
  • Spring Boot实现日志链路追踪
  • 孝义网站建设南京网站销售
  • 网站后台都有哪些青海网站建设价格
  • 0.3、AI Agent 知识库、召回、Recall、Embedding等 相关的概念
  • 外卡收单那点事儿之Visa篇(3)
  • 虚拟机安装ikuai系统相关配置
  • VTK开发笔记(七):示例Cone4,一数据源多演员模式,在Qt窗口中详解复现对应的Demo
  • Java开发—JDK的安装和版本管理(macOS)
  • 初次使用remix
  • 文献阅读翻译工具的选择
  • YOLOv1原理介绍
  • c 网站建设教程win7 搭建iss网站
  • 镇江软件公司南宁网站建设优化案例
  • 火电厂VR安全培训系统有哪些:广州华锐互动构建 “安全元宇宙” 生态
  • 【计算机科学与应用】基于多光谱成像与边缘计算的物流安全风险预警模式及系统实现
  • 分布式架构未来趋势:从云原生到智能边缘的演进之路
  • 云原生系列Bug修复:Docker镜像无法启动的终极解决方案与排查思路
  • 元宇宙赋能智慧城市:重构城市治理与生活新生态
  • 算法笔试题具体在考什么领域的知识?计算机科学领域的基础:数据结构,计算机组成原理,操作系统,计算机网络
  • HarmonyOS安全与隐私:权限申请与敏感数据保护实战
  • 做促销的网站珠海网站建设厚瑜
  • 基于STM32F103ZET6实现6路舵机控制
  • 【案例实战】鸿蒙分布式智能办公应用的架构设计与性能优化
  • 嘉兴网站排名优化价格环保网站 中企动力建设
  • 网站注册页面html网站建设邀标书
  • spring AOP失效的原因
  • 阿里云国际代理:阿里云备份如何保障数据安全?