当前位置: 首页 > news >正文

ollama调用千问2.5-vl视频图片UI界面小程序分享

1、问题描述:

ollama调用千问2.5-vl视频图片内容,通常用命令行工具不方便,于是做了一个python UI界面与大家分享。需要提前安装ollama,并下载千问qwen2.5vl:7b 模型,在ollama官网即可下载。 (8G-6G 显卡可用),用于识别图片信息。之前还下载了 qwen3:8b版,发现也可以此程序调用,比图片识别更快,用qwen3:8b文字直接提问,随便输入张图片即可。图片不起作用。 不知为何qwen2.5vl:7b 默认只支持cpu预处理图片,所以,图片推理的过程非常慢。qwen3:8b 默认支持gpu,速度快100倍,反应迅速,机会秒回复。这就是gpu 与cpu,推理的天壤之别吧,哈哈。南无阿弥陀佛。

如下图:
在这里插入图片描述
使用方法:很简单,

2、图片推理:

模型管理列表栏,选择相应的qwen2.5vl:7b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,支持三张,太多图片推理太慢了。单张最快,cpu推理就是这样,之后,在提示词栏,输入要对图片做的推理要求,默认是描述图片内容,也可以问图片里的特殊的人事物,等等。也可以指定要求推理输出的文字字数,1000字以内没啥问题。
在这里插入图片描述

3、文字推理:

同理,在模型管理列表栏,选择相应的qwen3:8b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,随便选张图,如果之前已经选了,就忽略此步。之后,在提示词栏,输入要提问的提示词即可,几千字以内似乎没啥问题。南无阿弥陀佛。

4、程序免费下载地址:

程序下载地址:https://download.csdn.net/download/tian0000hai/90856287
南无阿弥陀佛。

http://www.dtcms.com/a/197444.html

相关文章:

  • .NET外挂系列:1. harmony 基本原理和骨架分析
  • Linux配置vimplus
  • 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)
  • 赋予AI更强的“思考”能力
  • 【通用大模型】Serper API 详解:搜索引擎数据获取的核心工具
  • 基于 STM32 的手持式安检金属探测器设计与实现
  • 【 Redis | 实战篇 秒杀优化 】
  • 基于simulink搭建的模块化多电平MMC仿真模型
  • 柔性直流输电系统介绍及simulink模型的搭建
  • 逆变器的输出外特性分析
  • 基于simulink的LCC-HVDC输电模型
  • 如何给PSCAD添加库文件
  • LC滤波器的参数设计
  • PWM整流器双闭环PI参数的整定
  • Ubuntu 命令
  • 【Linux网络】DNS与ICMP
  • traceroute命令: -g与-i 参数
  • 经典算法 求C(N, K) % mod,保证mod是质数
  • Java面向对象基础学习笔记
  • 字体样式集合
  • AI:人形机器人一定是人的形状吗?
  • 题单:汉诺塔问题
  • 深入了解 VPC 端点类型 – 网关与接口
  • Java的线程通信机制是怎样的呢?
  • Java、ssm(AI) 2025/5/17
  • MySQL 中 JOIN 和子查询的区别与使用场景
  • 《棒球万事通》球类运动有哪些项目·棒球1号位
  • 5.2.1_2二叉树的性质
  • Autosar Nvm下电存储实现方式-基于ETAS工具
  • Codeforces Round 1024 (Div.2)