【RL-VLM-F】算法框架图绘图学习笔记
RL-VLM-F
绘图描述
下面是一份针对该“RL-VLM-F 算法示意图”在内容结构、布局风格、配色与图标等方面的详细专业描述:
1. 整体布局与结构
-
模块划分
-
模块 A:Reinforcement Learning
- 放在左上角,白色圆角长方形卡片(card),带 subtle drop-shadow。
- 卡片标题置于左上方,“Reinforcement Learning” 字样,字体略大(如 16–18 pt),黑色,无粗体。
-
模块 B:Rollout Trajectories
- 紧邻 A 的右侧,等宽白色圆角卡片,标题“Rollout Trajectories”。
-
模块 C:Sampled Observation Pair & Task Description
-
位于 B 下面,稍微向左对齐,占据中间偏右位置,白色圆角卡片,内部分为上下两部分:
- 上半部:两张并排的观察帧(Observation),用细线分隔。
- 下半部:一行文本框,黑色等宽字体,内容为任务描述,例如
"Fold the cloth diagonally"
。
-
-
模块 D:Vision Language Model
- 紧靠 C 左侧,置于中央偏下,白色圆角卡片或标注贴纸(sticky note 风格),卡片内仅放一个简化的神经网络拓扑图示意,并在下方或右上角标注“Vision Language Model”。
-
模块 E:Preference Label
-
紧邻 D 的右侧,同样白色圆角卡片,内部上下两排:
- 上排展示一对帧对比图示(从 C 拆出),左侧为正确示例,上方绿色对勾;
- 下排为错误示例,下方红色叉号。
-
卡片标题“Preference Label”置于顶部中心。
-
-
模块 F:Reward Model
- 位于左下角,与 A 横向呼应,白色圆角卡片;
- 内部放一个与 D 类似但配色不同的神经网络节点拓扑图示意,卡片下方或右上角标注“Reward Model”。
-
-
连接及流程
- A → B:一条笔直的实线箭头,颜色为柔和蓝色,箭头指向 B。
- B → C:多条聚合的弯曲箭头(表示从多条 rollout 中采样),每条箭头顶端带一个小图像缩略(上下不同配色的布料形状),箭头汇聚到 C 顶部。
- C → D:一条直线箭头,连接 C 的右下角指向 D。
- D → E:一条虚线箭头(或实线皆可,但略细),指向 E。
- E → F:一条实线箭头,指向 F。
- F → A:一条弯曲的实线箭头,从 F 回连到 A 模块左侧,箭头末端在 A 内部,表示“Reward Learning”。箭头旁标注“Reward Learning”。
- A 内部:在 Environment 图标与 Policy 图标之间用双向虚线箭头环状连接,表示交互式训练环路。
-
流程注释
- 在 B → C 的箭头旁纵向标注“Sampling”(文字与箭头同色,斜体或小号字体)。
- 在 F → A 的箭头旁水平标注“Reward Learning”。
2. 配色与图标风格
-
卡片与文字
- 卡片底色:纯白,圆角约 8 px,投影微弱(偏灰 20% 不透明度,模糊半径 4 px,Y 偏移 2 px)。
- 标题文字:黑色(#000000),字号约 16–18 pt;正文标签、注释文字:深灰(#333333),字号约 12–14 pt。
-
主色调
-
箭头与流程线:柔和蓝色(Hue ≈ 200°, Saturation ≈ 50%,Lightness ≈ 60%);
-
图标:
- Environment(地球):绿 (#6CA65F) + 蓝 (#4A90E2) 扁平色块;
- Policy(机械臂):灰色 (#7F8C8D) + 粉色 (#F187A1) 点缀;
- Trajectory 缩略图:每条线对应小型布料形状,用粉色、橙色、紫色等浅色系;
- 对勾/叉号:对勾—纯绿色 (#2ECC71),叉号—纯红色 (#E74C3C)。
-
-
图标形式
- 扁平化(Flat Design):无渐变、无投影,使用统一线宽(约 2–3 px)的矢量图形;
- 简洁:图标内部不使用细节阴影,仅用纯色填充;节点图示(D、F)用彩色圆点 + 细线连边,节点颜色与主色调呼应(如浅蓝、浅红、浅黄)。
3. 文字与排版细节
- 所有模块标题均左对齐或居中,确保一致;
- 注释文字(Sampling、Reward Learning)使用斜体,字号比正文小 1–2 号;颜色与箭头一致;
- 任务描述下方的双引号与等宽字体(如 Consolas、Courier New)表现“代码/命令”风格;
- 整体间距:模块间水平/垂直间距保持在 24–32 px;箭头终点与卡片边缘留 8–12 px 空白。
小结
请学术助理按以上模块化、扁平化卡片式排版、柔和明亮色系、统一线宽与圆角的规范进行绘制。确保流程箭头、图标配色、文字排版与原图高度一致,以重现同样的视觉风格与结构逻辑。