当前位置: 首页 > wzjs >正文

网站备案制作免费凡科建站官网

网站备案制作,免费凡科建站官网,泰安建设网站,建了一个网站 如何找到放图片的文件夹BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 目前(2023)的图文模型都是基于端到端训练方式,大规模的模型和数据集导致了在预训练过程需要的大量计算。作者提出一种从离线、梯度…

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models

目前(2023)的图文模型都是基于端到端训练方式,大规模的模型和数据集导致了在预训练过程需要的大量计算。作者提出一种从离线、梯度冻结的图像、语言模型中提升图文的预训练模型。为了联系两个不同模态预训练模型,作者提出一种使用两个阶段预训练模型Querying Transformer (Q-Former)

一、预训练方法

这种预训练方法分为了两个阶段 (1)视觉语言特征表示学习阶段 (2)视觉到文本的生成学习阶段

1.1 Q-Former

主要作用就是对齐两个不同模态的冻结预训练模型

🟢 Q-Former包含了两个transformer子模块:(1)Image Transformer (特征提取) (2) Text transformer (作为文本编码器和解码器) ;

🟢 一组可学习的查询嵌入向量作为 Image Transformer 的输入,这些向量在self-attention layer相互联系以及通过 cross-attention layer与预训练的图像模型特征交互; 除此之外,这组可学习的嵌入向量也与文本token进行拼接作为Text transformer的输入;

🟢 将Q-Former初始化为 BERT base \text{BERT}_{\text{base}} BERTbase, cross-attention layer是随机初始化的;同时查询向量的大小为:( 32 × 768 32 \times 768 32×768)

在这里插入图片描述

1.2 视觉语言特征表示学习

第一阶段的训练目标是基于文本对,通过 Q-Former 与冻结图像编码器,使得可学习的 query 向量能够从图像中提取出与文本语义最相关、最具信息量的视觉特征。在这个阶段中,采用了与BLIP预训练过程近似的目标损失:Image-Text Contrastive Learning (ITC) 、Image-grounded Text Generation (ITG)、Image-Text Matching (ITM).

🟢 ITC:图像、文本特征对比学习,通过可学习的查询向量和Text transformer中的[CLS]计算相似度,为了防止数据泄露,采用unimodal self-attention,禁止 query 与文本 token 之间的直接交互;

🟢 ITG:将可学习的向量作为条件输入,以自回归的方式生成图像描述,采用了causal self-attention mask

🟢 ITM:二分类匹配任务,采用bi-directional self-attention mask

1.3 图像到文本的生成学习

第二阶段利用LLM的生成语言的能力来训练Q-Former。将图像通过图像冻结模型和Image Transformer得到与文本语义最相关、最具信息量的视觉特征。接着通过一个全连接层的线性变换,将大小转换为符合到LLM模型中的输入维度。作者尝试了两种LLM冻结模型:

(1) decoder-based LLMs : query 表征作为 LLM 的输入前缀(prefix) → LLM 自己完成文本生成

(2) encoder-decoder-based LLMs : 模型学习在给定图像(query 表征)+ 前缀(自定义)的条件下,生成后缀内容

在这里插入图片描述

架构类型模型例子输入方式损失函数类型说明
Decoder-onlyGPT, OPT, LLaMAQ-Former 输出作为前缀,LLM 自回归生成Language Modeling Lossquery → LLM 直接生成
Encoder-DecoderT5, BARTQ-Former 输出 + 前缀文本 → encoder 后缀文本作为 decoder targetPrefix Language Modeling Lossquery + prefix → 生成 suffix

文章转载自:

http://MwoFYqa1.sqgqh.cn
http://EKhazOhA.sqgqh.cn
http://JYu4QBTQ.sqgqh.cn
http://5kvnEeU7.sqgqh.cn
http://acQhJ39C.sqgqh.cn
http://Ea55LxKo.sqgqh.cn
http://hWSdJOwC.sqgqh.cn
http://kZd4obrm.sqgqh.cn
http://VFYlgjdz.sqgqh.cn
http://xOCjTBNG.sqgqh.cn
http://ptcbAY3A.sqgqh.cn
http://dxi9UduT.sqgqh.cn
http://DHxQ4rpZ.sqgqh.cn
http://CRD71z2L.sqgqh.cn
http://kBt8aWAw.sqgqh.cn
http://RgzG2FWN.sqgqh.cn
http://YnFurB9p.sqgqh.cn
http://lHa4MgHe.sqgqh.cn
http://LT4N9wuQ.sqgqh.cn
http://RVJAgDH2.sqgqh.cn
http://mog3oH4y.sqgqh.cn
http://eEguFnpI.sqgqh.cn
http://kx8lIHAJ.sqgqh.cn
http://WGrNny58.sqgqh.cn
http://M9c3hm1W.sqgqh.cn
http://0sCj1vtv.sqgqh.cn
http://LxIqnRbt.sqgqh.cn
http://5mwsdj7b.sqgqh.cn
http://nYjMKvci.sqgqh.cn
http://C7yxlBbm.sqgqh.cn
http://www.dtcms.com/wzjs/723039.html

相关文章:

  • 什么网站专做宠物物品新华路街道网站建设
  • 用jsp做的二手交易网站网易企业邮箱手机端
  • 鞋网站建设方案阿里云搜索引擎入口
  • 在线网站代码生成器wordpress文章目录修改
  • 深圳住房建设厅网站首页自媒体网站开发
  • 一站式网站开发天津网站建设诺亚
  • 宁波网站推广厂家电话图片在线压缩
  • 长沙制作网站软件安卓系统开发培训
  • 外贸网站怎样做推广新乡中企网站建设
  • 建立网站第一步网站ui设计
  • 网站开发找什么论文微信商城在哪里找
  • 朋友圈广告推广平台seo入门教程网盘
  • 高端 旅游 网站建设网站优化的主要任务
  • 网站从域名c#做的网站怎么上传图片
  • 一个网站的成功怎么做美食团购网站
  • 网站建设的程序南京建设工程网站
  • 字体多的网站山东服务好的seo
  • 乐清企业乐陵seo外包
  • 提供网站建设方案做农产品的网站名称
  • 山东网站seo设计青岛做网站企业排名
  • 设计公司灰白色调网站分销平台有哪些?
  • 专门做网站的公司与外包公司有哪些123上网之家网址
  • 电子商务网站策划 ppt电商平台app大全
  • 网站建设竞价托管比较网站建设
  • 要做网站到哪里做网站域名骗子
  • 温州手机网站建设wmwl沈阳头条新闻
  • 汕头人才引进优化关键词排名提升
  • 建设银行泰州分行网站wordpress seo 链接
  • wordpress刷新错位百度seo搜索
  • 南山做网站的手机app页面设计