当前位置：首页 > news >正文

ollama接入图像识别大模型

news 2025/11/1 19:27:34

安装ollama和qwen2.5-vl

安装ollama

ollama run qwen2.5vl

控制台调用

在这里插入图片描述

api调用

api

请求地址http://localhost:11434/api/chat
请求内容

{"model": "qwen2.5vl","stream": false,"messages": [{"role": "user","content": "有效期是多少","images": ["图片的base64编码"]}]
}

在这里插入图片描述

python

cd /home/wjl/python-project
mkdir ollamastu
cd ollamastu
uv venv -p3.12 .venv
uv inituv add requests

在这里插入图片描述
把图片复制过去 cp /mnt/e/Desktop/001.jpg /home/wjl/python-project/ollamastu/，然后修改mian.py代码

import requests
import base64
import jsonif __name__=="__main__":# 图片转Base64with open("001.jpg", "rb") as image_file:image_data = base64.b64encode(image_file.read()).decode('utf-8')# API请求参数payload = {"model": "qwen2.5vl","prompt": "注册证编号是多少","images": [image_data]}# 发送请求response = requests.post("http://localhost:11434/api/generate",json=payload,stream=True)# 处理响应for chunk in response.iter_lines():if chunk:print(json.loads(chunk)["response"])

在这里插入图片描述

参考

https://blog.csdn.net/csdn122345/article/details/145701484
https://blog.csdn.net/weixin_42357472/article/details/146221932

http://www.dtcms.com/a/210832.html

相关文章：

PINN高阶技术综合应用：复杂问题求解与神经算子进阶

C/C++STL---＜chrono＞

redis功能清单

【Unity】使用InputSystem实现UI控件与键盘输入绑定以及如何快速制作虚拟摇杆

Pycharm和Flask的学习心得（7）

236.二叉树的最近公共祖先

python web开发-Flask模板引擎Jinja2完全指南

进一步学习线程相关知识

vue3中使用computed

Python 爬虫之requests 模块的应用

Vue组件通信的 `$attrs`与`$listeners`的优先级

高效大型语言模型推理优化综述

Reason-ModernColBERT论文速览：Sentence- bert-基于孪生bert网络的句子嵌入

基于SpringBoot+Vue的家政服务系统源码适配H5小程序APP

人脸识别流程与算法对比报告

ES 面试题系列「三」

(已开源-CVPR2024) RadarDistill---NuScenes数据集Radar检测第一名

Java—— IO流的应用

OpenLayers 加载鼠标位置控件

电子人的分水岭-FPGA模电和数电

CMSIS-NN：2.神经网络到CMSIS-NN的转换

TypeScript 完全指南（三）：工程化实战，搭建高效 TS 项目架构

keil直接生成bin文件

JDK21深度解密 Day 4：虚拟线程底层实现原理

leetcode2466，爬楼梯变体，取模注意

国际前沿知识系列三：解决泛化能力不足问题

29-FreeRTOS事件标志组

开发者工具箱-鸿蒙AES加密解密开发笔记

HTTP基本概述

机器学习开发全流程