当前位置: 首页 > wzjs >正文

做的最好的微电影网站有哪些土特产 网站源码

做的最好的微电影网站有哪些,土特产 网站源码,网站开发者收入来源,泰州专业制作网站多模态大模型通用架构: 在通用的MM-LLM(Multi-Modality LLM)框架里,共有五个模块,整体以LLM为核心主干,分别在前后有一个输入、输出的投影模块(Projector),投影模块主要…

多模态大模型通用架构:

在通用的MM-LLM(Multi-Modality LLM)框架里,共有五个模块,整体以LLM为核心主干,分别在前后有一个输入、输出的投影模块(Projector),投影模块主要是用于桥接不同模态输入和输出。输入投影模块(Input Projector)用于将模态编码器处理的不同模态特征映射到文本特征空间,以便输入给LLM;输出投影模块(Output Projector)用于将文本特征空间结果映射到模态生成器的输入空间,以引导模态生成器生成多模态结果。

(https://zhuanlan.zhihu.com/p/25267823390)

一、23.08 qwenvl发版

qwenvl 第一代分三个阶段训练,

①clip在图像语义级理解较强,但在ocr和图像细节理解弱。qwenvl准备1T图像-文本对,得到ocr/语义都很强的vit;

②在clip的基础上做多任务预训练;

③instruct监督微调。冻结vit。

(24.08 qwen2vl)

二、25.01 qwen2.5vl

1)原生图像分辨率:尽量保持(需要resize至被28整除)原有图像分辨率和长宽比。在112*112窗口内做14*14的window attention,最后2*2merge成原图视野域为28*28的token。

2)视频动态FPS采样:在视频数据中,用2*14*14的三维卷积将连续两帧图像合并为一张特征图。在采样时按照绝对时间(如0.5秒一帧)顺序排列,并按照绝对帧序进行三维空间的位置编码。所谓动态FPS采样,即将不同采样间隔的图像序列merge到一起,兼容长短期动作的多样性。

      图像处理:对图像做复制操作,使得单一图片,变成一个时序为2的帧序列。

3)M-ROPE(Multi-Modal Rotational Positional Embedding):文本text位置编码是一维,图像是二维,视频是三维。ROPE通过旋转矩阵相乘的形式编码(可参考https://zhuanlan.zhihu.com/p/719388479)。对于文本模态,只需要三个维度位置编码相同即可与视频对齐。

4)更高效的视觉编码器vit:大部分是window attention,112*112窗口内做14*14的window attention,window size实际上只有8*8;仅在[7,15,23,31]的4层做了full attention;ViT 架构与采用了 RMSNorm 和 SwiGLU 结构。

5)视觉定位能力:在做一些grounding任务时,qwen2vl会将box的坐标点做 (0,1000) 的规范化处理,在qwen2.5vl版本中,不进行坐标归一化,而是使用实际的像素点来表示坐标,这样能是模型学习到图像的真实尺寸信息。

6)参数分布:在3/7/72B版本的qwen中,vit结构和参数是一模一样的(600+M),只是在2*2merge时,为了match LM中的维度做了不同的升维。

7)训练方式:

8)最高图像/视频尺度,最多支持32k长度的token,即32k*28*28区域的图像。

9)qwen2.5vl-3/7/32/72B不同规模对应着llm的尺度,即qwen2.5vl-3B用的LLM模型时qwen2.5-3B。


文章转载自:

http://MA8OkNoH.gpsrk.cn
http://Ly5JTBvD.gpsrk.cn
http://l4N29ZJb.gpsrk.cn
http://uwMkcyBK.gpsrk.cn
http://sP3Qo26v.gpsrk.cn
http://o1eF2HGx.gpsrk.cn
http://eCeDjis1.gpsrk.cn
http://KYcH6K0k.gpsrk.cn
http://B6EMCrlG.gpsrk.cn
http://H53akU6U.gpsrk.cn
http://eS6CYtod.gpsrk.cn
http://R7eT8fCq.gpsrk.cn
http://9R74LwBX.gpsrk.cn
http://g4LNnT98.gpsrk.cn
http://a6Unadzf.gpsrk.cn
http://ULm27rYq.gpsrk.cn
http://t8yaRvYC.gpsrk.cn
http://6pUj2yrs.gpsrk.cn
http://dQy393Fi.gpsrk.cn
http://2L8ECE25.gpsrk.cn
http://2uDAlMdC.gpsrk.cn
http://Odio5rfY.gpsrk.cn
http://XlYoyZQq.gpsrk.cn
http://vOa6ZjQK.gpsrk.cn
http://m75aApzy.gpsrk.cn
http://9uIvBMZy.gpsrk.cn
http://3WoUod1G.gpsrk.cn
http://hys0cRGa.gpsrk.cn
http://wzGzjwIf.gpsrk.cn
http://PYm8zPol.gpsrk.cn
http://www.dtcms.com/wzjs/660729.html

相关文章:

  • 郑州便宜网站建设网站服务器ip地址怎么查
  • 阜康网站建设手机制作音乐的软件app
  • 旅游网站推荐凯里网站建设哪家专业
  • 烟台环保网站建设环境文化建设方案网站
  • 在青岛建网站微信网页版登录手机版
  • 哪个网站做黑色星期五订酒店活动外贸那些网站好用吗
  • 从0建设一个网站小米网站制作
  • 建公司网站外贸网站建设作品
  • 搭建网站有哪些昭通网络推广
  • 江西省建设协会网站动漫设计在哪里可以学
  • 小公司如何做网站wordpress刷量插件
  • 广州建设网站wordpress默认注册框
  • 旅游自媒体网站怎么做ajax wordpress
  • 凡科网站怎么做网站创建软件
  • 怎么用php做网站后台程序辽宁响应式网站建设推荐
  • 四川省工程项目建设投标发布网站莱芜上汽大众4s店
  • 基于oa系统的网站建设青岛seo代理计费
  • 怎么登录已注册的网站支付宝签约网站
  • 帮一个公司做网站多少钱wordpress nana
  • 商业机构的网站是什么文山知名网站建设哪家好
  • 做软件的网站建设深圳平价的专业建站公司
  • 看视频做那个网站好网络服务提供者知道或应当知道
  • 门户网站 方案网站前台模块包括什么软件
  • 昆山做网站微信网站模版下载
  • 给人做网站的wordpress主题安装完后前台打不开
  • 甘肃企业网站建设网页开发报价单
  • 东莞网站设计师重庆速代网络科技
  • python做网站的实例wordpress添加边栏
  • 吴忠网站建设公司鄂尔多斯网站推广
  • 四川鸿业建设集团网站快速排名工具免费查询