当前位置：首页 > news >正文

ollama调用千问2.5-vl视频图片UI界面小程序分享

news 2025/10/19 12:00:35

1、问题描述：

ollama调用千问2.5-vl视频图片内容，通常用命令行工具不方便，于是做了一个python UI界面与大家分享。需要提前安装ollama，并下载千问qwen2.5vl:7b 模型，在ollama官网即可下载。（8G-6G 显卡可用），用于识别图片信息。之前还下载了 qwen3:8b版，发现也可以此程序调用，比图片识别更快，用qwen3:8b文字直接提问，随便输入张图片即可。图片不起作用。不知为何qwen2.5vl:7b 默认只支持cpu预处理图片，所以，图片推理的过程非常慢。qwen3:8b 默认支持gpu，速度快100倍，反应迅速，机会秒回复。这就是gpu 与cpu，推理的天壤之别吧，哈哈。南无阿弥陀佛。

如下图：
在这里插入图片描述
使用方法：很简单，

2、图片推理：

在模型管理列表栏，选择相应的qwen2.5vl:7b模型，点击选择模型按钮，之后，直接在最下面，点击选择图片按钮，支持三张，太多图片推理太慢了。单张最快，cpu推理就是这样，之后，在提示词栏，输入要对图片做的推理要求，默认是描述图片内容，也可以问图片里的特殊的人事物，等等。也可以指定要求推理输出的文字字数，1000字以内没啥问题。
在这里插入图片描述

3、文字推理：

同理，在模型管理列表栏，选择相应的qwen3:8b模型，点击选择模型按钮，之后，直接在最下面，点击选择图片按钮，随便选张图，如果之前已经选了，就忽略此步。之后，在提示词栏，输入要提问的提示词即可，几千字以内似乎没啥问题。南无阿弥陀佛。

4、程序免费下载地址：

程序下载地址：https://download.csdn.net/download/tian0000hai/90856287
南无阿弥陀佛。

http://www.dtcms.com/a/197444.html

相关文章：

.NET外挂系列：1. harmony 基本原理和骨架分析

Linux配置vimplus

数字人技术的核心：AI与动作捕捉的双引擎驱动（210）

赋予AI更强的“思考”能力

【通用大模型】Serper API 详解：搜索引擎数据获取的核心工具

基于 STM32 的手持式安检金属探测器设计与实现

【 Redis | 实战篇秒杀优化】

基于simulink搭建的模块化多电平MMC仿真模型

柔性直流输电系统介绍及simulink模型的搭建

逆变器的输出外特性分析

基于simulink的LCC-HVDC输电模型

如何给PSCAD添加库文件

LC滤波器的参数设计

PWM整流器双闭环PI参数的整定

Ubuntu 命令

【Linux网络】DNS与ICMP

traceroute命令: -g与-i 参数

经典算法求C(N, K) % mod，保证mod是质数

Java面向对象基础学习笔记

字体样式集合

AI：人形机器人一定是人的形状吗？

题单：汉诺塔问题

深入了解 VPC 端点类型 – 网关与接口

Java的线程通信机制是怎样的呢？

Java、ssm(AI) 2025/5/17

MySQL 中 JOIN 和子查询的区别与使用场景

《棒球万事通》球类运动有哪些项目·棒球1号位

5.2.1_2二叉树的性质

Autosar Nvm下电存储实现方式-基于ETAS工具

Codeforces Round 1024 (Div.2)