当前位置: 首页 > news >正文

LLM多模态模型应用探索调研

Qwen3-VL

https://github.com/QwenLM/Qwen-VL

阿里研发的大规模视觉语言模型,以图像、文本、检测框作为输入,并以文本和检测框作为输出。

InternVL(InternVL 3.0)

https://github.com/OpenGVLab/InternVL

InternVL,书生·万象多模态大模型,一个性能强大的开源多模态大模型,MIT许可。

InternVL包括从适合边缘设备的1B模型到更为强大的78B模型。

在很多领域取测试,比如MMMU、MathVista、ChatQA、DocVQA、InfographicVQA、MMBench等测试中InternVL取得优秀表现。

Sana

Sana AI绘画大模型

https://github.com/NVlabs/Sana

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers

https://arxiv.org/abs/2410.10629

reference

---

Qwen3-VL

https://qwen3.org/vl/

Qwen3-VL

https://github.com/QwenLM/Qwen-VL

InternVL(InternVL 3.0)

https://github.com/OpenGVLab/InternVL

书生·万象多模态大模型(InternVL)系列

https://zhuanlan.zhihu.com/p/703940563

SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers

https://arxiv.org/abs/2410.10629

Awesome Chinese LLM(包含医学、法律等领域的LLM)

https://github.com/HqWu-HITCS/Awesome-Chinese-LLM.git

【多模态理解与生成统一模型】LLM+image token生成范式原理与代码解析

https://zhuanlan.zhihu.com/p/8305891572

Sana - 英伟达等推出的开源图像生成模型,支持生成4096×4096图像

https://www.aihub.cn/ai-model/sana/

Sana

https://github.com/NVlabs/Sana

CVPR2024|底层视觉(超分辨率,增强,恢复,去雨,去雾等)相关论文汇总(附论文链接/代码/解析)[持续更新]

https://zhuanlan.zhihu.com/p/684196283

http://www.dtcms.com/a/324209.html

相关文章:

  • 【0基础3ds Max】主工具栏介绍(下)
  • 故障诊断 | VMD-CNN-LSTM西储大学轴承故障诊断附MATLAB代码
  • 智慧社区--4
  • 【C++详解】红黑树规则讲解与模拟实现(内附红黑树插入操作思维导图)
  • 本地代码上传Github步骤
  • 《设计模式》UML类图
  • 通过trae开发你的第一个Chrome扩展插件
  • A4.0:继C5.2的BJT理论引申的开关作用的应用示例
  • DAY36打卡
  • 计算机网络:求地址块128.14.35.7/20中的相关信息
  • 枚举-dfs深度优先搜索
  • 女子试穿4条裤子留下血渍赔50元引争议:消费责任边界在哪?
  • C/C++类型转换(C++四大强制类型转换)
  • 北京JAVA基础面试30天打卡06
  • 编程基础之多维数组——矩阵交换行
  • 每日五个pyecharts可视化图表-line:从入门到精通 (2)
  • 周学会Matplotlib3 Python 数据可视化-绘制折线图(Lines)
  • GPT-5与中国AI发展(DeepSeek R1视角)
  • 基于Django的图书馆管理系统的设计与实现
  • drippingblues靶机通关练习笔记
  • Jotai:React轻量级状态管理新选择
  • 【Bluetooth】【Transport层篇】第六章 基于SDIO的蓝牙硬件发送协议 SDIO Transport详解
  • QT常用控件三
  • Redis 简介与 redis-plus-plus 使用指南
  • Gin 框架错误处理机制详解
  • 第三章 向量
  • 如何培养自己工程化的能力(python项目)
  • 编程基础之多维数组——同行列对角线的格
  • Qt中的设计模式:经典的MVC,MVP和MVVM
  • 娃哈哈经销商“大洗牌”:砍掉年销300万以下经销商