当前位置: 首页 > wzjs >正文

做的最好的微电影网站有哪些html 网站添加悬浮二维码

做的最好的微电影网站有哪些,html 网站添加悬浮二维码,东莞市中考管理系统,酒生产企业网站建设的目的多模态大模型通用架构: 在通用的MM-LLM(Multi-Modality LLM)框架里,共有五个模块,整体以LLM为核心主干,分别在前后有一个输入、输出的投影模块(Projector),投影模块主要…

多模态大模型通用架构:

在通用的MM-LLM(Multi-Modality LLM)框架里,共有五个模块,整体以LLM为核心主干,分别在前后有一个输入、输出的投影模块(Projector),投影模块主要是用于桥接不同模态输入和输出。输入投影模块(Input Projector)用于将模态编码器处理的不同模态特征映射到文本特征空间,以便输入给LLM;输出投影模块(Output Projector)用于将文本特征空间结果映射到模态生成器的输入空间,以引导模态生成器生成多模态结果。

(https://zhuanlan.zhihu.com/p/25267823390)

一、23.08 qwenvl发版

qwenvl 第一代分三个阶段训练,

①clip在图像语义级理解较强,但在ocr和图像细节理解弱。qwenvl准备1T图像-文本对,得到ocr/语义都很强的vit;

②在clip的基础上做多任务预训练;

③instruct监督微调。冻结vit。

(24.08 qwen2vl)

二、25.01 qwen2.5vl

1)原生图像分辨率:尽量保持(需要resize至被28整除)原有图像分辨率和长宽比。在112*112窗口内做14*14的window attention,最后2*2merge成原图视野域为28*28的token。

2)视频动态FPS采样:在视频数据中,用2*14*14的三维卷积将连续两帧图像合并为一张特征图。在采样时按照绝对时间(如0.5秒一帧)顺序排列,并按照绝对帧序进行三维空间的位置编码。所谓动态FPS采样,即将不同采样间隔的图像序列merge到一起,兼容长短期动作的多样性。

      图像处理:对图像做复制操作,使得单一图片,变成一个时序为2的帧序列。

3)M-ROPE(Multi-Modal Rotational Positional Embedding):文本text位置编码是一维,图像是二维,视频是三维。ROPE通过旋转矩阵相乘的形式编码(可参考https://zhuanlan.zhihu.com/p/719388479)。对于文本模态,只需要三个维度位置编码相同即可与视频对齐。

4)更高效的视觉编码器vit:大部分是window attention,112*112窗口内做14*14的window attention,window size实际上只有8*8;仅在[7,15,23,31]的4层做了full attention;ViT 架构与采用了 RMSNorm 和 SwiGLU 结构。

5)视觉定位能力:在做一些grounding任务时,qwen2vl会将box的坐标点做 (0,1000) 的规范化处理,在qwen2.5vl版本中,不进行坐标归一化,而是使用实际的像素点来表示坐标,这样能是模型学习到图像的真实尺寸信息。

6)参数分布:在3/7/72B版本的qwen中,vit结构和参数是一模一样的(600+M),只是在2*2merge时,为了match LM中的维度做了不同的升维。

7)训练方式:

8)最高图像/视频尺度,最多支持32k长度的token,即32k*28*28区域的图像。

9)qwen2.5vl-3/7/32/72B不同规模对应着llm的尺度,即qwen2.5vl-3B用的LLM模型时qwen2.5-3B。


文章转载自:

http://W7LIvP8x.pbzgj.cn
http://nJ70LgIK.pbzgj.cn
http://TVvy52xW.pbzgj.cn
http://5oV91qpz.pbzgj.cn
http://dqteLkNu.pbzgj.cn
http://o1C4ckhn.pbzgj.cn
http://M9atnPUU.pbzgj.cn
http://RXsC8Uv3.pbzgj.cn
http://HzhUxADY.pbzgj.cn
http://aXnarbg2.pbzgj.cn
http://ntJfXKxQ.pbzgj.cn
http://xCxNpgMq.pbzgj.cn
http://8VNLHwXQ.pbzgj.cn
http://jtuaRgcH.pbzgj.cn
http://YDRfpvuA.pbzgj.cn
http://nwrpwfKc.pbzgj.cn
http://eT839gox.pbzgj.cn
http://tKERzMB2.pbzgj.cn
http://VkzF10CH.pbzgj.cn
http://Y74Zk4NR.pbzgj.cn
http://TvYTSmz2.pbzgj.cn
http://Q0LIMAZa.pbzgj.cn
http://Mwt8BPcw.pbzgj.cn
http://7h4E3iqS.pbzgj.cn
http://uFuuPJbA.pbzgj.cn
http://yeyT7IKo.pbzgj.cn
http://9C3qg9Dy.pbzgj.cn
http://Tz6TOsRl.pbzgj.cn
http://b5Lq37ky.pbzgj.cn
http://1Ctdvo0Q.pbzgj.cn
http://www.dtcms.com/wzjs/712205.html

相关文章:

  • 三合一网站有必要吗网络公司网站源码
  • 手机网站免费生成app郴州365网
  • 网站开发工程师学什么wordpress获取当前页地址
  • 江苏省工程建设招标网站免费个人logo设计网站
  • 常州市金坛区网站建设内蒙古建设 招聘信息网站
  • 做十个网站做优惠券的网站有哪些
  • 国外网站开发公司asp网站开发后如何交付
  • 怎么样做网站赚钱婚礼效果图网站
  • 班组建设展板哪个网站有建设银行电子银行网站
  • 广州网站制作网站服务器上的php4.0网站连接sql2005服务器连接不上
  • 哪个网站可以做视频播放器影视头像logo设计
  • 华强北 网站建设网站建设 接单
  • 论坛类网站如何备案wordpress 和织梦
  • 视频网站开发项目青岛官网seo技术厂家
  • 网站转微信小程序开发这么做输入文字的网站
  • 企业不做网站商业论坛网
  • 找做网站个人做旅游网站
  • 西安高端网站开发网站营销 海外
  • 珠海酒店网站建设网站设计的书
  • 湖南品牌网站建设高端私人订制网站建设
  • 那个网站可教做课件好舟山网站建设有哪些
  • 如何做好网站建设内容的策划推广任务平台
  • 做网站学网站运营的作用
  • 电影项目做产品众筹哪个网站好网页无法访问摄像头
  • 宿松做网站手机免费表格软件app
  • 猪八戒网网站开发需求thinkphp网站后台模板
  • 柳州网站建设价格免费咨询做网站
  • wordpress视频网站用什么播放器成都旅游团
  • 兰州网站建设q479185700惠网站手机优化
  • 建设部网站 自住房推广软件的种类