当前位置：首页 > news >正文

large-scale-DRL-exploration 代码阅读（五）

news 2025/11/3 13:59:54

接下来的代码主要剩余：worker 强化学习中的收集经验的部分

还有就是主要是探索、构建环境相关的代码了；和强化学习关系不是很大了，即探索部分。

agent.py

map_info: 机器人实时构建的地图，初始化是一个和真实地图尺寸一样，但都是未知栅格状态的地图
updating_map：机器人周围的局部探索范围地图，尺寸大于感知范围，在这个局部范围提取边界点和生成视点，做探索规划

python 语法

1. a = np.array([10, 20, 30, 20])
np.where(a == 20)

返回一个元组，a 是几维就返回几维的元组，每一维是一个数组，存放的是相应的在这一维的索引。

如：a 是 1D：(array([1, 3]),) # 长度为1的元组

b = np.array([[1, 2],
[3, 2]])
np.where(b == 2)

return: (array([0, 1]), array([1, 1]))

元组长度 = 数组维度 = 2
第一个数组 → 行索引
第二个数组 → 列索引
组合起来表示满足条件的位置：(0,1) 和 (1,1)

2. np.lib.pad(unknown, ((1, 1), (1, 1)), 'constant', constant_values=0)

在unknown 这个2D矩阵的最左侧右侧上册下册均padding 一行一列 0 常数

unknown[2:][:, 1:x_len + 1]

取2d数组的第2行到最后一行和第一列到第 x_len 列

从0开始的

np.where(map_info.map.ravel(order='F') == FREE)[0]

map_info.map.ravel(order='F') 2D 数组按列展成1D数组

np.where（）返回元组

[0] 取元组第一个元素，展成1D了，所以本质上这个元组只有一维，长度为1，然后这个维度里面才是数组，存储的是在这一维上==FREE的元素的索引。

np.intersect1d(frontier_cell_1, frontier_cell_2)

两个数组的交集

x = np.linspace(0, x_len - 1, x_len)

np.linspace(start, stop, num)

start：起始值
stop：终止值（包含在内）
num：生成的样本点个数
返回：等间距的 num 个点组成的 一维数组

t1, t2 = np.meshgrid(x, y)

np.meshgrid 用于生成二维网格坐标矩阵。

x：一维数组，表示 列坐标
y：一维数组，表示 行坐标
返回两个矩阵：
- t1：每个格子的 x坐标
- t2：每个格子的 y坐标

举例（小网格 3×3）: so nine cells

x = [0, 1, 2]
y = [0, 1, 2]
t1, t2 = np.meshgrid(x, y)

t1：

[[0, 1, 2],
[0, 1, 2],
[0, 1, 2]]

t2：

[[0, 0, 0],
[1, 1, 1],
[2, 2, 2]]

解释：

t1[i,j] → 第 i 行、第 j 列的 x坐标
t2[i,j] → 第 i 行、第 j 列的 y坐标

也就是说 (t1[i,j], t2[i,j]) 就是第 i,j 个格子的二维索引。

注意这里是 行 i 对应 y，列 j 对应 x

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

(1) `t1.T`

对 t1 做转置
转置后保证**列优先展平（Fortran 顺序）**和之前 ravel(order='F') 的索引对应
2️⃣ 为什么要 .T？
前面前沿检测的索引是 列优先（order='F')） 展平的：
前面的操作一直是按列优先
如果直接 t1.ravel()，展开顺序是 按行优先（默认 C 风格）
列优先展开 (order='F')) 的顺序才和前面的索引匹配

(2) `.ravel()`

将二维矩阵展平为一维数组
t1.T.ravel() → 所有格子的 x 坐标按列优先排列
t2.T.ravel() → 所有格子的 y 坐标按列优先排列

(3) `np.vstack([..., ...])`

把两个一维数组 垂直堆叠（stack vertically）
结果是一个 2×N 的数组：

[[x0, x1, x2, ..., xN-1],
[y0, y1, y2, ..., yN-1]]

(4) `.T`

转置一次，把形状改成 N×2：

[[x0, y0],
[x1, y1],
[x2, y2],
...
[xN-1, yN-1]]

3️⃣ 小例子（3×3 网格）

x = [0, 1, 2]
y = [0, 1, 2]
t1, t2 = np.meshgrid(x, y)
cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T
print(cells)

t1:

[[0 0]
[0 1]
[0 2]
[1 0]
[1 1]
[1 2]
[2 0]
[2 1]
[2 2]]

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

frontier_cell = cells[frontier_cell_indices]

cells = np.array([
[0,0], [0,1], [0,2],
[1,0], [1,1], [1,2],
[2,0], [2,1], [2,2]
])

frontier_cell_indices = np.array([1, 5, 7])
frontier_cell = cells[frontier_cell_indices]
print(frontier_cell)

输出：

[[0 1]
[1 2]
[2 1]]

downsampled_data = set(map(tuple, voxel_dict.values()))

这一行代码的作用是 把下采样后的点从 NumPy 数组转换成集合形式

1️⃣ `voxel_dict.values()`

voxel_dict 是一个字典，每个体素只保留了一个点
voxel_dict.values() 返回字典中所有保留的点，是一个 可迭代对象
每个点本身是一个 NumPy 数组，形状 (2,)，表示 (x, y) 坐标

2️⃣ `map(tuple, ...)`

NumPy 数组不能直接作为集合的元素，因为数组 不可哈希
用 map(tuple, ...) 把每个点从数组转换成元组 (x, y)
元组是可哈希的，可以放进 Python 集合中

3️⃣ `set(...)`

将所有元组放入集合，得到 去重后的点集
保证每个体素只保留一个点，同时方便后续做集合运算

查看全文

http://www.dtcms.com/a/562405.html

亚马逊网站的建设目标网站建设方案及

C 标准库 - `＜stdarg.h＞`

顺德网站制作公司汕头市住房和城乡建设局网站

南宁网站建设公司怎么接单kingcms 暂未创建网站首页

010网站建设郑州网站建设找哪家好

【QT】安装包

网站建设课程的感想彩票网站开发软件

网软志成免费部队网站源码下载网站建设后台实训体会

自适应网站如何做移动适配衡水做网站建设

【软考架构】案例分析-云侧AI与端侧AI

三.Docker镜像及其私有库

网站建设国内外研究现状模板长沙百度网站推广优化

开展建设文明网站活动网络营销专业怎么样

云南省网站开发软件WordPress连接微博

网站建设布吉wordpress 亲子主题

邹城网站网站建设企业车辆管理系统平台

网站建设绿茶科技域名注册报备

Learning Transferable Visual Models From Natural Language Supervision 学习笔记

开源项目分享：Gitee热榜项目 2025-11-2 日榜

简述网站建设基本流程图php做的网站代码

网络服务商能删除网站珠海网络网站建设

PsTools 学习笔记（7.10）：PsFile——远程“谁在占用这个文件/共享”的取证与解占用

怎样查找网站域名归属地推是什么意思

做网站需要什么软件教程西安做网站公司8

电商网站平台哪个网站做ppt好

代码笔记：Dark Experience for General Continual Learning a Strong, Simple Baseline

简约网站建设公司郑州网站建设智巢

网站建设张景鹏做广告推广哪家好

windows安装oracle19c

辉县市工程建设网站建设做一款微信小程序多少钱

large-scale-DRL-exploration 代码阅读（五）

agent.py

python 语法

1. a = np.array([10, 20, 30, 20])
np.where(a == 20)

2. np.lib.pad(unknown, ((1, 1), (1, 1)), 'constant', constant_values=0)

unknown[2:][:, 1:x_len + 1]

np.where(map_info.map.ravel(order='F') == FREE)[0]

np.intersect1d(frontier_cell_1, frontier_cell_2)

x = np.linspace(0, x_len - 1, x_len)

t1, t2 = np.meshgrid(x, y)

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

(1) `t1.T`

2️⃣ 为什么要 `.T`？

(2) `.ravel()`

(3) `np.vstack([..., ...])`

(4) `.T`

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

frontier_cell = cells[frontier_cell_indices]

downsampled_data = set(map(tuple, voxel_dict.values()))

1️⃣ `voxel_dict.values()`

2️⃣ `map(tuple, ...)`

3️⃣ `set(...)`

相关文章：

agent.py

python 语法

1. a = np.array([10, 20, 30, 20]) np.where(a == 20)

2. np.lib.pad(unknown, ((1, 1), (1, 1)), 'constant', constant_values=0)

unknown[2:][:, 1:x_len + 1]

np.where(map_info.map.ravel(order='F') == FREE)[0]

np.intersect1d(frontier_cell_1, frontier_cell_2)

x = np.linspace(0, x_len - 1, x_len)

t1, t2 = np.meshgrid(x, y)

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

(1) t1.T

2️⃣ 为什么要 .T？

(2) .ravel()

(3) np.vstack([..., ...])

(4) .T

cells = np.vstack([t1.T.ravel(), t2.T.ravel()]).T

frontier_cell = cells[frontier_cell_indices]

downsampled_data = set(map(tuple, voxel_dict.values()))

1️⃣ voxel_dict.values()

2️⃣ map(tuple, ...)

3️⃣ set(...)

相关文章：

1. a = np.array([10, 20, 30, 20])
np.where(a == 20)

(1) `t1.T`

2️⃣ 为什么要 `.T`？

(2) `.ravel()`

(3) `np.vstack([..., ...])`

(4) `.T`

1️⃣ `voxel_dict.values()`

2️⃣ `map(tuple, ...)`

3️⃣ `set(...)`