当前位置: 首页 > news >正文

【大模型部署】Ollama部署gguf模型

以OpenBMB的MiniCPM-V-4.5为例

1. 下载gguf模型,以modelscope为例

(1)可以直接下载,https://modelscope.cn/models/OpenBMB/MiniCPM-V-4_5-gguf/files

(2)命令行下载,下载单个文件或全部文件

modelscope download --model OpenBMB/MiniCPM-V-4_5-gguf ggml-model-Q4_1.gguf --local_dir D:\01_LLM\02_models\OpenBMB\MiniCPMv4_5_Q4_1

也可以下载全部文件

modelscope download --model OpenBMB/MiniCPM-V-4_5-gguf

2. 找到下载位置,创建modelfile文件,名称可以自定义xxx.mf

from ./ggml-model-Q4_1.gguf

3. 构建ollama模型

确认开启ollama服务

nohup ollama serve &

构建ollama模型

ollama create minicpmv45q41 -f ./minicpmv45q41.mf

4. 运行模型

ollama run minicpmv45q41

感谢观看!

http://www.dtcms.com/a/393138.html

相关文章:

  • Coze源码分析-资源库-删除工作流-前端源码-核心组件
  • 机器学习实战第八章 降维
  • 2025年csp-j真题和解析
  • C++ STL map 深度解析:从原理到实战的全方位指南
  • 【EKF组合导航例程】MATLAB代码,15维状态量、3维观测量的组合导航,滤波使用EKF(扩展卡尔曼滤波)。附下载链接
  • word文档怎么根据大纲拆分章节
  • 【Modbus】Modbus协议基础知识详解
  • Springboot使用Integration实现MQTT发送和接收消息
  • 中国传统文化上衣下裳
  • zk管理kafkakafka-broker通信
  • 前端开发技术趋势Web Components
  • Python tarfile库详解
  • ​​[硬件电路-287]:高性能六通道数字隔离器CA-IS3763L 功能概述与管脚定义
  • 错题集系统接口文档
  • 【RAG-LLM】InfoGain-RAG基于文档信息增益的RAG
  • Browser-Use深度解析:重新定义AI与浏览器的智能协作
  • 【Mysql】事务隔离级别、索引原理、/redolog/undolog/binlog区别、主从复制原理
  • AWS 全景速查手册
  • 小米Openvela城市沙龙
  • Python数据分析:求矩阵的秩。啥是矩阵秩?听故事学线代并用Python实现,娘来太容易学会了!
  • UI Toolkit自定义元素
  • redis未授权访问-漏洞复现
  • PR调节器与PI调节器的区别
  • Unity核心概念⑫:碰撞检测
  • 【读论文】面向工业的ASR语音大模型
  • 重谈IO——五种IO模型及其分类
  • 数据库造神计划第十七天---索引(2)
  • 【开题答辩实录分享】以《车联网位置信息管理软件》为例进行答辩实录分享
  • (3)机器学习-模型介绍
  • 如何在 Ubuntu 20.04 LTS 上安装 MySQL 8