当前位置: 首页 > news >正文

多模大模型

<原力值失效>...

今天打开了csdn,惊喜(jingkong)的发现原力值失效了, 本来以为我怎么也能每年有个几篇文章的, 结果一看, 自从换了工作, 文章数断崖下降,23 24年居然一篇没有...   一定是因为被资本主义(gongsidalao)持续压榨中,真是天天都心力交瘁啊....

不多说废话了,简单总结下最近比较火的 qwen-vl, 先不说算法, 先说下怎么用起来~ 

现在有很多框架, 都支持各种大模型, vl的文本的都是支持的

说一种比较通用的方式: 

step1: 拉取 llama factory最新代码到自己的分支下面 LLaMA Factory

然后,从魔塔下载对应的模型文件 魔搭社区

按照 llama factory 给的示例 写一个shell脚本调用就行 

多模对应的数据大部分都是mllm打头,比较好找,注意vl的文件需要处理对应的训练数据, 图片需要下载到本地,并且在训练文件中img_url 写入对应的图片地址

模型对比: qwen2.5效果比qwen2 好很多,具体可以参考这篇文章 https://zhuanlan.zhihu.com/p/11442714235,总结下就是qwen2还是初版小白的多模大模型, qwen2.5强化了很多文本侧的能力。模型大小的话,7b对比效果差距已经很明显了, 72b肯定是最惊艳的,7b一些基础任务效果已经很不错了,大家有兴趣可以尝试下看看~

先水一篇,要继续搬砖去了,有问题欢迎讨论, 后续会继续补充丰富内容~

相关文章:

  • JS数组方法
  • Modbus TCP转ProfiNet协议转换网关构建三菱L系列PLC与伺服的冗余通信架构
  • 运行前端项目报错解决方法
  • Redis原理:watch命令
  • springboot启动事件CommandLineRunner使用
  • RocketMQ 使用手册
  • 排序--快排--挖坑法
  • 电机控制 | 仿真分析:基于脉冲高频注入的永磁同步电机无感控制
  • doris:容灾管理概览
  • es新增运算符
  • 小程序实现瀑布流布局
  • 【MySQL】用户账户、角色、口令、PAM
  • 【miniconda】centos7安装miniconda
  • 【装饰器】【python】【@wraps详解】装饰器核心问题:元数据丢失解决,以及原理
  • 贪心算法经典应用:最优答疑调度策略详解与Python实现
  • ngx_rtmp_flv_module.c — FLV文件处理模块设计与分析
  • JavaScript基础-常用的键盘事件
  • 第三课:Stable Diffusion图生图入门及应用
  • 跨语言微服务架构(Java、Python)——“API中台”
  • SQL小菜之TOP N查找问题
  • 丰富“互换通”产品类型,促进中国金融市场高水平对外开放
  • 苏轼“胡为适南海”?
  • 基金经理调仓引发大金融板块拉升?公募新规落地究竟利好哪些板块
  • 七旬男子驾“老头乐”酒驾被查,曾有两次酒驾两次肇事记录
  • 巴方:印度上周导弹袭击造成至少40名平民死亡
  • 超新星|18岁冲击中超金靴,王钰栋的未来无限可能