当前位置: 首页 > news >正文

ollama调用千问2.5-vl视频图片UI界面小程序分享

1、问题描述:

ollama调用千问2.5-vl视频图片内容,通常用命令行工具不方便,于是做了一个python UI界面与大家分享。需要提前安装ollama,并下载千问qwen2.5vl:7b 模型,在ollama官网即可下载。 (8G-6G 显卡可用),用于识别图片信息。之前还下载了 qwen3:8b版,发现也可以此程序调用,比图片识别更快,用qwen3:8b文字直接提问,随便输入张图片即可。图片不起作用。 不知为何qwen2.5vl:7b 默认只支持cpu预处理图片,所以,图片推理的过程非常慢。qwen3:8b 默认支持gpu,速度快100倍,反应迅速,机会秒回复。这就是gpu 与cpu,推理的天壤之别吧,哈哈。南无阿弥陀佛。

如下图:
在这里插入图片描述
使用方法:很简单,

2、图片推理:

模型管理列表栏,选择相应的qwen2.5vl:7b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,支持三张,太多图片推理太慢了。单张最快,cpu推理就是这样,之后,在提示词栏,输入要对图片做的推理要求,默认是描述图片内容,也可以问图片里的特殊的人事物,等等。也可以指定要求推理输出的文字字数,1000字以内没啥问题。
在这里插入图片描述

3、文字推理:

同理,在模型管理列表栏,选择相应的qwen3:8b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,随便选张图,如果之前已经选了,就忽略此步。之后,在提示词栏,输入要提问的提示词即可,几千字以内似乎没啥问题。南无阿弥陀佛。

4、程序免费下载地址:

程序下载地址:https://download.csdn.net/download/tian0000hai/90856287
南无阿弥陀佛。

相关文章:

  • .NET外挂系列:1. harmony 基本原理和骨架分析
  • Linux配置vimplus
  • 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)
  • 赋予AI更强的“思考”能力
  • 【通用大模型】Serper API 详解:搜索引擎数据获取的核心工具
  • 基于 STM32 的手持式安检金属探测器设计与实现
  • 【 Redis | 实战篇 秒杀优化 】
  • 基于simulink搭建的模块化多电平MMC仿真模型
  • 柔性直流输电系统介绍及simulink模型的搭建
  • 逆变器的输出外特性分析
  • 基于simulink的LCC-HVDC输电模型
  • 如何给PSCAD添加库文件
  • LC滤波器的参数设计
  • PWM整流器双闭环PI参数的整定
  • Ubuntu 命令
  • 【Linux网络】DNS与ICMP
  • traceroute命令: -g与-i 参数
  • 经典算法 求C(N, K) % mod,保证mod是质数
  • Java面向对象基础学习笔记
  • 字体样式集合
  • 大学2025丨专访西湖大学副校长邓力:如何才能培养“不惧未知”的创新者
  • 肖钢:一季度证券业金融科技投资强度在金融各子行业中居首
  • 常州新型碳材料集群产值近二千亿,请看《浪尖周报》第24期
  • 福州一宋代古墓被指沦为露天厕所,仓山区博物馆:已设置围挡
  • 《制止滥用行政权力排除、限制竞争行为规定(修订草案征求意见稿)》公开征求意见
  • 悬疑剧背后的女编剧:创作的差异不在性别,而在经验