当前位置: 首页 > news >正文

ollama接入图像识别大模型

安装ollama和qwen2.5-vl

安装ollama

ollama run qwen2.5vl

控制台调用

在这里插入图片描述

api调用

api

请求地址http://localhost:11434/api/chat
请求内容

{"model": "qwen2.5vl","stream": false,"messages": [{"role": "user","content": "有效期是多少","images": ["图片的base64编码"]}]
}

在这里插入图片描述

python

cd /home/wjl/python-project
mkdir ollamastu
cd ollamastu
uv venv -p3.12 .venv
uv inituv add requests

在这里插入图片描述
把图片复制过去 cp /mnt/e/Desktop/001.jpg /home/wjl/python-project/ollamastu/,然后修改mian.py代码

import requests
import base64
import jsonif __name__=="__main__":# 图片转Base64with open("001.jpg", "rb") as image_file:image_data = base64.b64encode(image_file.read()).decode('utf-8')# API请求参数payload = {"model": "qwen2.5vl","prompt": "注册证编号是多少","images": [image_data]}# 发送请求response = requests.post("http://localhost:11434/api/generate",json=payload,stream=True)# 处理响应for chunk in response.iter_lines():if chunk:print(json.loads(chunk)["response"])

在这里插入图片描述

参考

https://blog.csdn.net/csdn122345/article/details/145701484
https://blog.csdn.net/weixin_42357472/article/details/146221932

http://www.dtcms.com/a/210832.html

相关文章:

  • PINN高阶技术综合应用:复杂问题求解与神经算子进阶
  • C/C++STL---<chrono>
  • redis功能清单
  • 【Unity】使用InputSystem实现UI控件与键盘输入绑定以及如何快速制作虚拟摇杆
  • Pycharm和Flask的学习心得(7)
  • 236.二叉树的最近公共祖先
  • python web开发-Flask模板引擎Jinja2完全指南
  • 进一步学习线程相关知识
  • vue3中使用computed
  • Python 爬虫之requests 模块的应用
  • Vue组件通信的 `$attrs`与`$listeners`的优先级
  • 高效大型语言模型推理优化综述
  • Reason-ModernColBERT论文速览:Sentence- bert-基于孪生bert网络的句子嵌入
  • 基于SpringBoot+Vue的家政服务系统源码适配H5小程序APP
  • 人脸识别流程与算法对比报告
  • ES 面试题系列「三」
  • (已开源-CVPR2024) RadarDistill---NuScenes数据集Radar检测第一名
  • Java—— IO流的应用
  • OpenLayers 加载鼠标位置控件
  • 电子人的分水岭-FPGA模电和数电
  • CMSIS-NN:2.神经网络到CMSIS-NN的转换
  • TypeScript 完全指南(三):工程化实战,搭建高效 TS 项目架构
  • keil直接生成bin文件
  • JDK21深度解密 Day 4:虚拟线程底层实现原理
  • leetcode2466,爬楼梯变体,取模注意
  • 国际前沿知识系列三:解决泛化能力不足问题
  • 29-FreeRTOS事件标志组
  • 开发者工具箱-鸿蒙AES加密解密开发笔记
  • HTTP基本概述
  • 机器学习开发全流程