当前位置: 首页 > news >正文

14、deepseek视觉大模型Janus Pro本地部署及实战

1、简介

2025.01.27: Janus-Pro发布,Janus的高级版本,显著提高了多模态理解和视觉生成。
Janus-Pro 是 Janus 的高级版本。具体来说, Janus-Pro 包括以下改进:优化的训练策略、 扩展的训练数据以及更大规模的模型。通过这些改进, Janus-Pro 在多模态理解和文本生成图像的指令跟 随能力上取得了显著进步,同时还提升了文本生成图像的稳定性。

git连接
在这里插入图片描述
Janus 是一种新颖的自回归框架,它统一了多模态理解和生成。它通过将视觉编码解耦为单独的路径来解决以前方法的局限性,同时仍然使用单一、统一的 transformer 架构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,也增强了框架的灵活性。Janus 超越了以前的统一模型,并达到或超过特定于任务的模型的性能。Janus 的简单性、高度灵活性和有效性使其成为下一代统一多模态模型的有力候选者。

Janus模型运行硬件要求,Janus Pro对硬件要求较低,以下是1B模型和7B模型运行的GPU显存占用情况:

任务类型Janus-Pro-1BJanus-Pro-7B
图像识别5G15G
图片生成14G40G

2、安装

2.1 下载源码文件

在这里插入图片描述
上传服务器解压

2.2 虚拟环境创建

conda create -n janus python=3.9 -y

激活环境

conda init
source ~/.bashrc
conda activate janus

安装依赖

cd /Janus-main pip install -e

3、下载模型文件

考虑到国 内网络环境,这里推荐直接在Modelscope上进行模型权重下载。

  • Janus-Pro-1B模型权重: https://www.modelscope.cn/models/deepseek-ai/Janus-Pro-1B
  • Janus-Pro-7B模型权重: https://www.modelscope.cn/models/deepseek-ai/Janus-Pro-7B

安装modelscope

pip install modelscope

创建文件夹

cd Janus-main 
mkdir ./Janus-Pro-1B
mkdir ./Janus-Pro-7B
# 下载1B模型
modelscope download --model deepseek-ai/Janus-Pro-1B --local_dir ./Janus-Pro-1B

在这里插入图片描述

# 下载7B模型
modelscope download --model deepseek-ai/Janus-Pro-7B --local_dir ./Janus-Pro-7B

在这里插入图片描述

4、 Gradio前端调用方法

此外,Janus项目中还提供了前端调用脚本,我们可以按照如下流程开启前端并与Janus进行对话。

安装相关依赖

pip install -e .[gradio]

修改模型调用的本地地址
在这里插入图片描述

python demo/app_januspro.py

运行完成
在这里插入图片描述
会生成一个公网可访问的地址。
在这里插入图片描述
在这里插入图片描述

5、简单测试

5.1 图生文

显存占用(7B)
在这里插入图片描述
效果
在这里插入图片描述

5.2 文生图

显存占用
在这里插入图片描述
效果查看
在这里插入图片描述
英文的提示词效果会好一些

相关文章:

  • 【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
  • C# ASP.NET的未来发展趋势
  • ElasticSearch基础和使用
  • SOUI基于Zint生成Code 2 of 5码
  • (5/100)每日小游戏平台系列
  • Vue3(1)
  • 探索顶级汽车软件解决方案:驱动行业变革的关键力量
  • Create Deploy Your Website Quickly - Docusaurus GitHub Pages
  • 2.14学习记录
  • 28、深度学习-自学之路-NLP自然语言处理-做一个完形填空,让机器学习更多的内容程序展示
  • DeepSeek 引领AI新潮流:Janus-Pro 打破多模态理解与生成的边界
  • 探索Hugging Face:开源AI社区的核心工具与应用实践
  • 【Xposed】在 Android Studio 中使用 Kotlin DSL 自动结束并启动应用进程
  • Zabbix告警队列清理教程
  • JUC并发—Java集合包底层源码剖析
  • 麒麟系统离线安装SVN
  • 【Elasticsearch】Elasticsearch检索方式全解析:从基础到实战(一)
  • [css] 黑白主题切换
  • poetry shell - 作为插件安装和使用
  • Django开发入门 – 5. Web框架与MVT架构
  • 起底新型保健品电话销售诈骗:从快递信息中筛选对象,忽悠其高价买药
  • 印巴矛盾已达近年“最高点”:军政经文全面紧张,巴将向联合国通报局势
  • 习近平同欧洲理事会主席科斯塔、欧盟委员会主席冯德莱恩就中欧建交50周年互致贺电
  • 杨德龙:取得长期投资胜利法宝,是像巴菲特一样践行价值投资
  • 马克思主义理论研究教学名师系列访谈|王公龙:做好马克思主义研究,既要“钻进去”又要“跳出来”
  • 这 3 种食物,不要放进微波炉!第 1 个就大意了