当前位置: 首页 > news >正文

ollama加载本地自定义模型

因为我们自己微调好的模型就属于自定义的模型了,而且我们微调好的模型也不想泄露出去,所以我们就需要这个ollama加载自定义模型方式进行使用

微调模型:https://blog.csdn.net/YXWik/article/details/146207556
ollama安装:https://blog.csdn.net/YXWik/article/details/143871588
ollama支持的是gguf文件格式,如果是HF的需要进行转换:https://blog.csdn.net/YXWik/article/details/147117404

在这里插入图片描述
首先要新建一个 Modelfile文件,这个文件放哪里都行,最好跟ollama模型放一块
我这里放到了F:\tools\ollama下起名叫huanhuan.Modelfile

在这里插入图片描述
Modelfile的内容

# 基础模型(二选一)
# 1. 使用官方模型 
# FROM llama3.1 
# 2. 使用本地自定义模型(需取消注释并验证路径)
FROM "F:/tools/models/export/Qwen2.5-Coder-0.5B-F16.gguf" 
 
# 参数设置 
# 取值范围 0-1,值越高输出越随机 
PARAMETER temperature 1  

 
# 系统提示词 
SYSTEM "你是甄嬛传的知识助手"

注册模型

ollama create huanhuan -f  F:/tools/ollama/huanhuan.Modelfile

成功
在这里插入图片描述
注册成功后进行使用

 ollama run huanhuan

在这里插入图片描述

踩坑记录

Modelfile的内容

#FROM llama3.1 #官方支持的模型
FROM F:/tools/models/export/Qwen2.5-Coder-0.5B-F16.gguf #必须 自定义支持的模型,路径加模型文件名
#不是必须 温度参数,参数越大,分布曲线压的越平
PARAMETER temperature 1
#不是必须 设置系统提示词,
SYSTEM "You are Mario from Super Mario Bros. Answer as Mario, the assistant, only."

注册模型

ollama create huanhuan -f  F:/tools/ollama/huanhuan.Modelfile

出现以下报错: Error: unexpected EOF
在这里插入图片描述
在这里插入图片描述
更改Modelfile 内容 并采用管理员窗口进行注册

# 基础模型(二选一)
# 1. 使用官方模型 
# FROM llama3.1 
 
# 2. 使用本地自定义模型(需取消注释并验证路径)
FROM "F:/tools/models/export/Qwen2.5-Coder-0.5B-F16.gguf" 
 
# 参数设置 
PARAMETER temperature 1  # 取值范围 0-1,值越高输出越随机 
 
# 系统提示词 
SYSTEM "你是一个擅长代码生成和问题解答的助手"

再次注册出现以下报错 Error: invalid float value [1 # 取值范围 0-1,值越高输出越随机]
在这里插入图片描述
因为 # 取值范围 0-1,值越高输出越随机PARAMETER temperature 1 这一行,换行后解决

# 基础模型(二选一)
# 1. 使用官方模型 
# FROM llama3.1 
 
# 2. 使用本地自定义模型(需取消注释并验证路径)
FROM "F:/tools/models/export/Qwen2.5-Coder-0.5B-F16.gguf" 
 
# 参数设置 
PARAMETER temperature 1  
# 取值范围 0-1,值越高输出越随机 
 
# 系统提示词 
SYSTEM "你是一个擅长代码生成和问题解答的助手"

相关文章:

  • 在 Linux 系统(ubuntu/kylin)上安装 Docker
  • 玻璃厂退火炉“温度智囊”:Profinet转ModbusRTU网关
  • 目标检测YOLO实战应用案例100讲- 基于卷积神经网络的小目标检测算法研究与应用
  • 灵霄破茧:仙途启幕 - 灵霄门新篇-(4)
  • linux环境定时重启服务的流程分享
  • 关于FocalLoss 损失函数
  • 【C++算法】54.链表_合并 K 个升序链表
  • Ansible:role企业级实战
  • 4-6记录(B树)
  • 使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第七讲)
  • 【React】副作用 setState执行流程 内置钩子(Effect Callback Reducer)React.memo
  • 从 STP 到 RSTP 再到 MSTP:网络生成树协议的工作机制与发展
  • Docker部署.NetCore8项目
  • 【Axure视频教程】中继器表格轮播含暂停效果
  • 蓝桥杯真题:数字串个数
  • 【今日三题】小乐乐改数字 (模拟) / 十字爆破 (预处理+模拟) / 比那名居的桃子 (滑窗 / 前缀和)
  • Spring Security6 从源码慢速开始
  • 系统思考—提升解决动态性复杂问题能力
  • C++对象生命周期管理:从构造到析构的完整指南
  • Unity Addressables资源生命周期自动化监控技术详解