NeighborGeo:基于邻居的IP地理定位(二)
NeighborGeo:基于neighbors的IP地理定位
X. Wang, D. Zhao, X. Liu, Z. Zhang, T. Zhao, NeighborGeo: IP geolocation based on neighbors, Comput. Netw. 257 (2025) 110896,
2. Related work
本节介绍了与本文提出的方法相关的一些工作,主要包括IP地理定位和图结构学习。
2.1 IP geolocation
IP地理定位是一个重要的研究领域,其任务是根据IP地址推断用户的位置。在过去的文献中,研究人员从多个角度探索了这一问题,主要分为数据挖掘、主动网络测量、机器学习与深度学习三个方面。
数据挖掘技术利用从互联网上获取的各种信息,包括网页内容[17]、WHOIS数据库[18]、反向域名[17]、邮政地址[19]、网络摄像头[20]等。例如,NetGeo[18]分析WHOIS记录来预测位置,checkin - geo[21]使用通过checkin服务和PC登录日志共享的位置数据来进行位置定位,而最近的GeoCAM利用网络摄像头收集的数据进行位置分析[20]。这些方法通常依赖被动收集的网络数据,可能不可靠和不完整,导致定位不准确。
主动网络测量基于网络延迟与地理距离正相关的原理,一度是IP地理定位的主流方法。早期的工作如geoping[17]涉及从地理上分散的探测主机向目标ip发送ICMP数据包,利用最近的地标服务器的位置作为地理定位的参考。CBG[22]在地球表面围绕每个地标服务器创建圆圈,以推断目标IP的位置。TBG[23]将网络延迟信息与traceroute获得的拓扑测量相结合,实现更精确的位置估计。虽然这些方法已经被证明是有效的,但它们受限于极端网络测量的不稳定性和对专家经验的依赖,限制了它们的可扩展性。
目前,随着机器学习和深度学习的发展,越来越多的相关方法被应用到IP地理定位中。NN-Geo[1]利用多个源的往返时间作为特征,并采用径向基函数神经网络进行IP地理定位。另一方面,MLPGeo[25]使用多层感知器网络,输入IP地址及其特征,集成其他信息(如路由器id)来直接映射测量特征和纬度/经度标签之间的关系。然而,随后的研究表明,多层感知器并不适合对具有非欧氏结构的数据进行建模,如计算机网络。为应对这一挑战,GNN-Geo[15]将IP地理定位重新定义为属性图节点回归问题,使用gnn从目标IP主机周围的知识中提取信息。因此,图神经网络已被广泛用于IP本地化。GraphGeo[5]将IP主机知识和邻域关系集成到一个图中,利用不确定性感知的图神经网络进行IP地理定位,而RIPGeo[24]专注于地理定位系统的稳定性,并提出了一种有效的扰动训练策略来增强图表示学习的稳定性。
虽然图学习方法可以有效地利用域信息进行定位预测,提高IP定位精度,但IP特征学习固有的局限性往往导致不可靠的结构和域信息。在实际应用中,标记点往往是分散的、不规则的,且往往分布不均匀。传统方法容易受到远处地标的影响,导致显著误差。因此,在实际场景中重点关注选择合适的邻居进行精确定位,从而进一步提高定位精度至关重要。
2.2 Graph Structure Learning
图结构学习&