当前位置: 首页 > news >正文

【RL-VLM-F】算法框架图绘图学习笔记

RL-VLM-F

在这里插入图片描述

绘图描述

下面是一份针对该“RL-VLM-F 算法示意图”在内容结构布局风格配色与图标等方面的详细专业描述:

1. 整体布局与结构

  1. 模块划分

    • 模块 A:Reinforcement Learning

      • 放在左上角,白色圆角长方形卡片(card),带 subtle drop-shadow。
      • 卡片标题置于左上方,“Reinforcement Learning” 字样,字体略大(如 16–18 pt),黑色,无粗体。
    • 模块 B:Rollout Trajectories

      • 紧邻 A 的右侧,等宽白色圆角卡片,标题“Rollout Trajectories”。
    • 模块 C:Sampled Observation Pair & Task Description

      • 位于 B 下面,稍微向左对齐,占据中间偏右位置,白色圆角卡片,内部分为上下两部分:

        • 上半部:两张并排的观察帧(Observation),用细线分隔。
        • 下半部:一行文本框,黑色等宽字体,内容为任务描述,例如 "Fold the cloth diagonally"
    • 模块 D:Vision Language Model

      • 紧靠 C 左侧,置于中央偏下,白色圆角卡片或标注贴纸(sticky note 风格),卡片内仅放一个简化的神经网络拓扑图示意,并在下方或右上角标注“Vision Language Model”。
    • 模块 E:Preference Label

      • 紧邻 D 的右侧,同样白色圆角卡片,内部上下两排:

        • 上排展示一对帧对比图示(从 C 拆出),左侧为正确示例,上方绿色对勾;
        • 下排为错误示例,下方红色叉号。
      • 卡片标题“Preference Label”置于顶部中心。

    • 模块 F:Reward Model

      • 位于左下角,与 A 横向呼应,白色圆角卡片;
      • 内部放一个与 D 类似但配色不同的神经网络节点拓扑图示意,卡片下方或右上角标注“Reward Model”。
  2. 连接及流程

    • A → B:一条笔直的实线箭头,颜色为柔和蓝色,箭头指向 B。
    • B → C:多条聚合的弯曲箭头(表示从多条 rollout 中采样),每条箭头顶端带一个小图像缩略(上下不同配色的布料形状),箭头汇聚到 C 顶部。
    • C → D:一条直线箭头,连接 C 的右下角指向 D。
    • D → E:一条虚线箭头(或实线皆可,但略细),指向 E。
    • E → F:一条实线箭头,指向 F。
    • F → A:一条弯曲的实线箭头,从 F 回连到 A 模块左侧,箭头末端在 A 内部,表示“Reward Learning”。箭头旁标注“Reward Learning”。
    • A 内部:在 Environment 图标与 Policy 图标之间用双向虚线箭头环状连接,表示交互式训练环路。
  3. 流程注释

    • 在 B → C 的箭头旁纵向标注“Sampling”(文字与箭头同色,斜体或小号字体)。
    • 在 F → A 的箭头旁水平标注“Reward Learning”。

2. 配色与图标风格

  1. 卡片与文字

    • 卡片底色:纯白,圆角约 8 px,投影微弱(偏灰 20% 不透明度,模糊半径 4 px,Y 偏移 2 px)。
    • 标题文字:黑色(#000000),字号约 16–18 pt;正文标签、注释文字:深灰(#333333),字号约 12–14 pt。
  2. 主色调

    • 箭头与流程线:柔和蓝色(Hue ≈ 200°, Saturation ≈ 50%,Lightness ≈ 60%);

    • 图标

      • Environment(地球):绿 (#6CA65F) + 蓝 (#4A90E2) 扁平色块;
      • Policy(机械臂):灰色 (#7F8C8D) + 粉色 (#F187A1) 点缀;
      • Trajectory 缩略图:每条线对应小型布料形状,用粉色、橙色、紫色等浅色系;
      • 对勾/叉号:对勾—纯绿色 (#2ECC71),叉号—纯红色 (#E74C3C)。
  3. 图标形式

    • 扁平化(Flat Design):无渐变、无投影,使用统一线宽(约 2–3 px)的矢量图形;
    • 简洁:图标内部不使用细节阴影,仅用纯色填充;节点图示(D、F)用彩色圆点 + 细线连边,节点颜色与主色调呼应(如浅蓝、浅红、浅黄)。

3. 文字与排版细节

  • 所有模块标题均左对齐或居中,确保一致;
  • 注释文字(Sampling、Reward Learning)使用斜体,字号比正文小 1–2 号;颜色与箭头一致;
  • 任务描述下方的双引号与等宽字体(如 Consolas、Courier New)表现“代码/命令”风格;
  • 整体间距:模块间水平/垂直间距保持在 24–32 px;箭头终点与卡片边缘留 8–12 px 空白。

小结

请学术助理按以上模块化扁平化卡片式排版柔和明亮色系统一线宽与圆角的规范进行绘制。确保流程箭头、图标配色、文字排版与原图高度一致,以重现同样的视觉风格与结构逻辑。

http://www.dtcms.com/a/272994.html

相关文章:

  • ubuntu server配置静态IP
  • ​​​​​​​微软PowerBI PL-300认证考试报名入口及费用
  • 【PTA数据结构 | C语言版】顺序队列的3个操作
  • 完美卸载 Ubuntu 双系统:从规划到实施的完整指南
  • 乐鑫代理商飞睿科技,ESP32模组重塑AIoT体验的四大技术支柱
  • C++类型萃取(Type Traits):深入解析std::enable_if与std::is_same
  • git fetch的使用
  • 【第五章-基础】Python 函数---以一个初学者来理解函数
  • 第十六天,7月10日,八股
  • 【网络安全】利用 Cookie Sandwich 窃取 HttpOnly Cookie
  • vue中token的使用与统计实践
  • android闪光灯源码分析
  • Android 插件化实现原理详解
  • 【读书笔记】如何画好架构图:架构思维的三大底层逻辑
  • 遥感影像图像分割-地物提取模型训练与大图直接推理流程
  • 突破传统局限:60G 3D毫米波雷达如何实现精准人体全状态检测?
  • Vue3基础知识
  • 论文笔记(LLM distillation):Distilling Step-by-Step!
  • 5、Vue中使用Cesium实现交互式折线绘制详解
  • 电脑被突然重启后,再每次打开excel文件,都会记录之前的位置窗口大小,第一次无法全屏显示。
  • imx6ul Qt运行qml报错This plugin does not support createPlatformOpenGLContext!
  • 无人机抗风模块运行与技术难点分析
  • Flowable22变量监听器---------------持续更新中
  • OneFileLLM:一键聚合多源信息流
  • 股指期货交割交易日到期没平仓盈亏以哪个价格计算?
  • RP2040使用存储系统
  • 2025年7月10日泛财经要闻精选
  • ACPU正式启动全球化布局,重构AI时代的中心化算力基础施设
  • 基于cornerstone3D的dicom影像浏览器 第三十二章 文件夹做pacs服务端,fake-pacs-server
  • 专题 数字(Number)基础