当前位置: 首页 > wzjs >正文

销售型网站有哪些沈阳百度seo

销售型网站有哪些,沈阳百度seo,网站建设侵权,电商设计软件有哪些tulerfeng/Video-R1: Video-R1: Reinforcing Video Reasoning in MLLMs [🔥the first paper to explore R1 for video] 1. 引述 在强化微调中,像 GRPO、DAPO 这样的方法都是对文本或者图片进行微调思考,所以这类微调方法不对时序信息做处理&…

tulerfeng/Video-R1: Video-R1: Reinforcing Video Reasoning in MLLMs [🔥the first paper to explore R1 for video]

1. 引述

在强化微调中,像 GRPO、DAPO 这样的方法都是对文本或者图片进行微调思考,所以这类微调方法不对时序信息做处理,因此无法很好的迁移到视频的强化微调中。

虽说目前有不少视频理解的工作,但是都没有加上强化微调的方法。也就是说,针对视频数据的强化微调很稀缺。

于是几个大学(港大+清华+中科大)联合搞了一个 Video-R1,提出 T-GRPO,实现对视频进行思考。

2. T-GRPO

T-GRPO 的核心思路如上图。

相比 GRPO,T-GRPO 的创新在于使大模型微调的时候,能关注时序信息。做法就是将视频数据复制一份,并将这一份的视频帧打乱,打乱视频帧的视频就没有时序信息了。

于是,设置奖励,使得模型在分析视频内容时,要求对有时序信息的视频帧分析正确,对乱序的视频帧分析错误。写成公式如下:(这里的 \alpha 设置为 0.3)

r_t = \begin{cases} \alpha, & \text{if } p \geq \tilde{p} \\ 0, & \text{otherwise} \end{cases}

于是乎,T-GRPO 的核心奖励如下:

R_i = \begin{cases} r_i + r_t, & \text{if } o_i \text{ is correct} \\ r_i, & \text{otherwise} \end{cases}

其中,r_i 代表问题是否回答正确。这个公式的意思就是说,如果有时序信息的视频帧的分析效果比乱序的更好,那么奖励就是 r_i+r_t

除此之外,还对模型输出长度通过奖励做了限制。如果输出长度少,还有额外奖励:

R_i = \begin{cases} R_i + \omega, & \text{if } o_i \text{ is correct and } l_{\min} \leq \mathrm{len}(o_i) \leq l_{\max} \\ R_i, & \text{otherwise} \end{cases}

最小长度 l_\text{min} 被设置为 320,最大长度 l_\text{max} 被设置为 512

http://www.dtcms.com/wzjs/82382.html

相关文章:

  • 网站的记住密码功能怎么做莱芜seo
  • 功能型网站建设google搜索引擎官网
  • 潍坊网站建设服务免费发布信息的平台
  • 中国建设银行网站对公账户首页天津seo推广软件
  • seo+网站排名济南网络营销外包
  • 百度提交网站收录地址关键词的优化方案
  • 嘉兴企业网站开发免费域名注册
  • 那些外贸网站个人可以做站长工具友链查询
  • 遵义建设厅网站官网全球疫情最新数据
  • 网络营销推广软件服务商seo网站推广是什么
  • 做网站被骗怎么办外贸网站建设
  • 加州网络公司排名深圳优化公司高粱seo较
  • 新闻网站怎样做seo优化如何推广引流
  • wordpress主题插件下载失败新乡网站优化公司
  • 网站什么时候做等保百度主页入口
  • 北京整站线上推广优化腾讯广告推广怎么做
  • 河北省住房与城乡建设厅网站广州代运营公司有哪些
  • 建企业网站一般需要多少钱搜索引擎哪个好用
  • 招聘网站建设初衷旅游app推广营销策略
  • 自做头像的网站seo搜索引擎优化岗位要求
  • 临淄专业网站优化哪家好网站管理工具
  • 找网站建设公司需要注意什么百度品牌广告
  • 图书馆门户网站建设的意义网络推广需要什么
  • 郴州网红打卡景点优化方案模板
  • 网站不备案影响收录吗推广网站怎么制作
  • 安徽和城乡建设厅网站年度关键词
  • 进入淘宝官网网站新闻发布稿
  • 毕节网站建设兼职网页优化最为重要的内容是
  • 做3d图的网站有哪些软件网站优化搜索排名
  • wordpress换空间搬家网站优化推广培训