当前位置: 首页 > news >正文

文献阅读——NeuroBayesSLAM

原文地址

1.核心理论:贝叶斯多感官整合框架

目标:结合视觉线索 c v i c_{vi} cvi和前庭线索 c v e c_{ve} cve来估计头部方向或位置 θ

贝叶斯公式

p ( θ ∣ c v i , c v e ) ∝ p ( c v i ∣ θ ) p ( c v e ∣ θ ) p ( θ ) p(\theta | c_{vi}, c_{ve}) \propto p(c_{vi} | \theta)p(c_{ve} | \theta)p(\theta) p(θcvi,cve)p(cviθ)p(cveθ)p(θ)

  • p ( θ ∣ c v i , c v e ) p(\theta | c_{vi}, c_{ve}) p(θcvi,cve):给定所有线索后, θ \theta θ 的后验概率分布。
  • p ( c v i ∣ θ ) / p ( c v e ∣ θ ) p(c_{vi} | \theta) / p(c_{ve} | \theta) p(cviθ)/p(cveθ):观察到线索 c v i / c v e c_{vi} / c_{ve} cvi/cve 的可能性,取决于真实状态 θ \theta θ
  • p ( θ ) p(\theta) p(θ) θ \theta θ 的先验概率(初始信念)。

简化假设

  • 没有先验时 p ( θ ) p(\theta) p(θ)均匀分布即为1。
  • 视觉和前庭线索的噪声相互独立。

时间迭代

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v i ∣ θ ) p t ( c v e ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta \mid c_{vi}, c_{ve}) \propto p^t(c_{vi} \mid \theta)p^t(c_{ve} \mid \theta)p^{t-1}(\theta \mid c_{vi}, c_{ve}) pt(θcvi,cve)pt(cviθ)pt(cveθ)pt1(θcvi,cve)

将当前时刻的线索与上一时刻的后验信念结合。
这个公式可以拆分为路径积分和地标校准:

路径积分 (Path Integration)

  • 利用前庭/运动线索更新估计。
  • 对应于贝叶斯框架中的前庭线索更新:

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v e ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta | c_{vi}, c_{ve}) \propto p^t(c_{ve} | \theta)p^{t-1}(\theta | c_{vi}, c_{ve}) pt(θcvi,cve)pt(cveθ)pt1(θcvi,cve)

模拟动物根据自身运动(步数、速度)不断更新位置的过程。

地标校准 (Landmark Calibration)

  • 利用视觉线索(熟悉地标)修正估计。
  • 对应于贝叶斯框架中的视觉线索更新:

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v i ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta \mid c_{vi}, c_{ve}) \propto p^t(c_{vi} \mid \theta)p^{t-1}(\theta \mid c_{vi}, c_{ve}) pt(θcvi,cve)pt(cviθ)pt1(θcvi,cve)

当看到熟悉的景象时,调整内部地图以匹配外部世界。

2.模型架构

在这里插入图片描述该图展示了模型的贝叶斯吸引子网络架构及其信息流动图表。

  • 头部方向细胞(Head Direction Cells)编码方向。
  • 网格细胞(Grid Cells)编码位置。

来自前庭线索和视觉线索的信息分别由整合细胞(Integrator Cells)和校准细胞(Calibration Cells)整合。

  • 整合细胞接收前庭路径积分信息。
  • 校准细胞接受视觉校准信息。

当线索冲突出现时,这两种细胞通过相互抑制和全局抑制来解决冲突,从而在网络中产生单峰活动。头部方向细胞网络中编码的方向被用于网格细胞网络中编码代理的位置。基于网格细胞网络提供的位置信息,构建了一个认知地图。

2.1 HD细胞网络

2.1.1表示
  • 每个细胞群体(整合细胞和校准细胞)维护一个一维高斯分布 p ( θ ) p(\theta) p(θ) 来表示对头部方向的信念。

p ( θ ) = 1 σ 2 π e − ∣ θ − μ ∣ 2 / 2 σ 2 p(\theta) = \frac{1}{\sigma\sqrt{2\pi}} e^{-|\theta - \mu|^2 / 2\sigma^2} p(θ)=σ2π 1eθμ2/2σ2

  • μ \mu μ:方向的最大似然估计(均值),代表当前头部方向
  • σ 2 \sigma^2 σ2:信念的不确定性(方差)
2.1.2 吸引子动力学

全局抑制:限制整体活动水平,防止过度兴奋。

1 ( σ inte t ) 2 = E W ( σ inte t − 1 ) 2 , 1 ( σ cali t ) 2 = E W ( σ cali t − 1 ) 2 \frac{1}{(\sigma_{\text{inte}}^{t})^{2}} = \frac{E}{W(\sigma_{\text{inte}}^{t-1})^{2}}, \quad \frac{1}{(\sigma_{\text{cali}}^{t})^{2}} = \frac{E}{W(\sigma_{\text{cali}}^{t-1})^{2}} (σintet)21=W(σintet1)2E,(σcalit)21=W(σcalit1)2E

  • W W W 是总信息量
  • E E E 是预设的总信息量上限

相互抑制:确保网络中只有一个稳定的“活动包”(单峰)占据主导地位。

1 ( σ inte t ) 2 = 1 ( σ inte t − 1 ) 2 − Δ inte 1 ( σ cali t − 1 ) 2 , 1 ( σ cali t ) 2 = 1 Δ cali 1 ( σ inte t − 1 ) 2 \frac{1}{(\sigma_{\text{inte}}^{t})^{2}} = \frac{1}{(\sigma_{\text{inte}}^{t-1})^{2}} - \Delta_{\text{inte}} \frac{1}{(\sigma_{\text{cali}}^{t-1})^{2}}, \quad \frac{1}{(\sigma_{\text{cali}}^{t})^{2}} = \frac{1}{\Delta_{\text{cali}}} \frac{1}{(\sigma_{\text{inte}}^{t-1})^{2}} (σintet)21=(σintet1)21Δinte(σcalit1)21,(σcalit)21=Δcali1(σintet1)21

  • Δ inte \Delta_{\text{inte}} Δinte Δ cali \Delta_{\text{cali}} Δcali 控制抑制强度
2.1.3路径积分更新

μ i n t e t = mod ( μ i n t e t − 1 + v t Δ t , 2 π ) \mu_{inte}^t = \text{mod}(\mu_{inte}^{t-1} + v^t \Delta t, 2\pi) μintet=mod(μintet1+vtΔt,2π)

μ c a l l t = mod ( μ c a l l t − 1 + v t Δ t , 2 π ) \mu_{call}^t = \text{mod}(\mu_{call}^{t-1} + v^t \Delta t, 2\pi) μcallt=mod(μcallt1+vtΔt,2π)

  • v t v^t vt:来自前庭系统的速度信息。
  • 由于方向具有周期性,故对 2 π 2\pi 2π取mod。
2.1.4视觉校准更新

当检测到熟悉视觉场景时,校准细胞接收注入能量 p inject ( θ ) p_{\text{inject}}(\theta) pinject(θ)

1 ( σ cali t ) 2 = 1 ( σ cali t − 1 ) 2 + 1 ( σ inject t ) 2 \frac{1}{(\sigma^t_{\text{cali}})^2} = \frac{1}{(\sigma^{t-1}_{\text{cali}})^2} + \frac{1}{(\sigma^t_{\text{inject}})^2} (σcalit)21=(σcalit1)21+(σinjectt)21

μ cali t = mod ( ( σ cali t ) 2 ( σ cali t − 1 ) 2 μ cali t − 1 + ( σ cali t ) 2 ( σ inject t ) 2 μ inject t , 2 π ) \mu^t_{\text{cali}} = \text{mod}\left( \frac{(\sigma^t_{\text{cali}})^2}{(\sigma^{t-1}_{\text{cali}})^2} \mu^{t-1}_{\text{cali}} + \frac{(\sigma^t_{\text{cali}})^2}{(\sigma^t_{\text{inject}})^2} \mu^t_{\text{inject}} \,,\, 2\pi \right) μcalit=mod((σcalit1)2(σcalit)2μcalit1+(σinjectt)2(σcalit)2μinjectt,2π)

  • σ inject t \sigma^{t}_{\text{inject}} σinjectt:注入能量的标准差
  • μ inject t \mu^{t}_{\text{inject}} μinjectt:注入能量的均值(预期校准方向)

最终信念是整合细胞和校准细胞信念的融合:

1 ( σ f t ) 2 = 1 ( σ inte t ) 2 + 1 ( σ cali t ) 2 \frac{1}{(\sigma_f^t)^2} = \frac{1}{(\sigma_{\text{inte}}^t)^2} + \frac{1}{(\sigma_{\text{cali}}^t)^2} (σft)21=(σintet)21+(σcalit)21

μ f t = mod ( ( σ f t ) 2 ( σ inte t ) 2 μ inte t + ( σ f t ) 2 ( σ cali t ) 2 μ cali t , 2 π ) \mu_f^t = \text{mod} \left( \frac{(\sigma_f^t)^2}{(\sigma_{\text{inte}}^t)^2} \mu_{\text{inte}}^t + \frac{(\sigma_f^t)^2}{(\sigma_{\text{cali}}^t)^2} \mu_{\text{cali}}^t \,,\, 2\pi \right) μft=mod((σintet)2(σft)2μintet+(σcalit)2(σft)2μcalit,2π)

  • σ f t \sigma_f^t σft:综合不确定性的标准差
  • μ f t \mu_f^t μft:综合方向估计(整合与校准的加权融合结果)
  • 公式说明:
    • 第一条公式体现整合(路径积分)和校准(地标修正)不确定性的加权调和平均
    • 第二条公式通过方差倒数作为权重,融合整合细胞( μ inte t \mu_{\text{inte}}^t μintet)和校准细胞( μ cali t \mu_{\text{cali}}^t μcalit)的估计

2.2 网格细胞网络

2.2.1表示
  • 类似于 HD 网络,但使用二维高斯分布 p ( x , y ) p(x, y) p(x,y) 来表示对位置的信念。

p ( x , y ) = 1 2 π σ x σ y e − ( ( x − μ x ) 2 2 σ x 2 + ( y − μ y ) 2 2 σ y 2 ) p(x, y) = \frac{1}{2\pi\sigma_x\sigma_y} e^{-\left( \frac{(x - \mu_x)^2}{2\sigma_x^2} + \frac{(y - \mu_y)^2}{2\sigma_y^2} \right)} p(x,y)=2πσxσy1e(2σx2(xμx)2+2σy2(yμy)2)

  • ( μ x , μ y ) (\mu_x, \mu_y) (μx,μy):位置的最大似然估计(均值),代表机器人在物理空间中的位置
  • σ x 2 , σ y 2 \sigma_x^2, \sigma_y^2 σx2,σy2:信念在两个维度上的不确定性
2.2.2神经空间
  • 采用具有周期性边界条件的二维神经空间(环面吸引子)。
  • ( x , y ) ∈ [ 0 , 2 π ) (x, y) \in [0, 2\pi) (x,y)[0,2π)
  • 均值 ( μ x , μ y ) (\mu_x, \mu_y) (μx,μy) 编码的实际位置需要通过解卷绕(unwrapping)操作来恢复
2.2.3更新机制

机制与HD网络类似,但作用于二维位置。

3 系统实现

在这里插入图片描述
图片展示了NeuroBayesSLAM系统的软件架构。传感器/bagfile节点提供图像和里程计信息。视觉里程计为纯视觉数据集提供速度估计。局部视图单元节点确定当前视图是否熟悉。贝叶斯吸引子网络节点执行路径积分并做出环闭合决策。经验地图节点生成拓扑地图。整个系统通过这些组件协同工作,实现对环境的建模和导航。

相关文章:

  • 【MySQL】 数据库基础数据类型
  • Unity EventCenter 消息中心的设计与实现
  • 蓝牙的选型、设计及测试
  • 电力设备类——如何使用YOLOv8模型对配网缺陷检数据集进行训练、评估和可视化 这个配网销钉缺失检测图像数据集 配网缺陷检测图像数据集 配网缺陷
  • Don’t Shake the Wheel 论文阅读
  • Docker部署OpenSearch集群
  • QT中延时的用法及定时器的用法
  • 用HTML5+JavaScript实现汉字转拼音工具
  • 基于DQN的学习资源难度匹配智能体
  • 静态库的使用方法
  • 基于OAuth2-proxy和Keycloak为comfyui实现SSO
  • MCP Server 实践之旅第 3 站:MCP 协议亲和性的技术内幕
  • StringBuilder 和 StringBuffer 的线程安全分析
  • 动态规划中的 求“最长”、“最大收益”、“最多区间”、“最优策略” 双重 for + 状态转移
  • 问题六、SIMTOSIM部分遇到的问题及解决方法
  • IP隧道技术中数据包头部的变化分析:必然增加的封装机制
  • 自学嵌入式 day 23 - 数据结构 树状结构 哈希表
  • 语音合成之十五 语音合成(TTS)分句生成拼接时的响度一致性问题:现状、成因与对策
  • python开发环境管理和包管理
  • 布丁扫描高级会员版 v3.5.2.2| 安卓智能扫描 APP OCR文字识别小助手
  • 佛山提供网站设计方案公司/泰安seo排名
  • 电子商务官方网站/百度网络优化推广公司
  • 内蒙古网站建设/网络销售推广平台
  • 遵义市做网站的地方/搜索引擎广告图片
  • 网站续费自己做/seo排名快速优化
  • 广州模板建站平台/石家庄疫情最新消息