当前位置：首页 > news >正文

【TKDE25】Large-Scale Clustering With Anchor-BasedConstrained Laplacian Rank

news 2025/10/31 6:28:53

1、摘要

基于图的聚类技术因其能够通过成对的图相似性精确地刻画信息而受到广泛关注。然而，传统方法中的后处理步骤常常导致关键信息的丢失，从而限制了聚类效果。为了解决这一问题，受限拉普拉斯秩（Constrained Laplacian Rank, CLR）理论被提出，旨在直接从最优结构图中获取离散标签，并取得了良好的效果。

然而，CLR方法存在显著的时间开销问题，导致其难以应用于大规模数据分析。为了解决这一问题，我们提出了一种简单而高效的基于锚点的CLR方法（ACLR），以实现高效的大规模聚类。

ACLR方法包括四个阶段：

选择可以粗略覆盖原始数据的锚点，以便构建二部图；
提出一种新颖的两步概率传递策略（TSPT），在锚点之间以随机游走概率初始化小规模图；
通过主模型交替优化图的连接结构，并直接生成锚点的离散标签，得益于大幅缩减的图规模，使得时间复杂度与样本数无关；
利用K近邻（K-NN）算法将锚点标签传播至所有样本。

大量实验表明，ACLR在聚类准确性和效率上均表现出色，尤其在处理大规模数据时更具优势。

代码地址：GitHub - MarathonZhenyuMa/2025-TKDE-ACLR: Source Code for Large-scale clustering with Anchor-based Constraint Laplacian Rank (ACLR) accepted by IEEE TKDE

2、相关工作

3、方法

3.1选锚点（四种方法）

随机、KM、KM++、BKHK

3.2构造初始图（三种方法）

3.3迭代算法model（6）

3.4锚点级到样本集标签传播

k近邻投票

4、主要创新

初始图构造的TSPT方法，以及锚点到样本的标签传播

5、实验

http://www.dtcms.com/a/211003.html

相关文章：

数据的获取与读取篇---常见的数据格式JSON

JVM（Java虚拟机）

从0到上线：微服务架构下的全栈开发实战指南

STM32 定时器输出比较深度解析：从原理到电机控制应用 (详解)

PostGIS实现栅格数据转二进制应用实践【ST_AsBinary】

Nat Rev Genet | 如果DNA序列能“说话”？深度学习S2E（序列2表达）模型正在听懂基因组的调控秘密！

数字图像处理：基于 hough 变换的图像边缘提取

iOS知识复习

vue3+ts 安装tailwindcss样式库

uniapp判断ios或Android定位是否开启并跳转到系统设置

白皮精读：2024年国家数据基础设施建设指引【附全文阅读】

BSDIFF算法详解

winsever2016Web服务器平台安装与配置

道德经总结

配置文件，xml，json，yaml，我该选哪个？

【RabbitMQ运维】集群搭建

基于ZYNQ的LWIP网络TCP/IP调试

leetcode 两两交换链表中的节点 java

深度学习——超参数调优

在Rockchip平台上利用FFmpeg实现硬件解码与缩放并导出Python接口

BLIP3-o：理解和生成统一的多模态模型

力扣 283.移动零（双指针）

怎么开发一个网络协议模块（C语言框架）之(三) 全局实例

计算机网络期末复习资料

《Java vs Go vs C++ vs C：四门编程语言的深度对比》

2025年渗透测试面试题总结-匿名[社招]安全工程师(中级红队)（题目+回答）

JS 中判断 null、undefined 与 NaN 的权威方法及场景实践

SQL 语言

Transformer 架构学习笔记

楼宇自控成建筑领域关键技术，为实现建筑碳中和注入强劲技术动能