当前位置: 首页 > news >正文

把llamafacoty微调后的模型导出ollama模型文件

按照llama.cpp.git

git clone https://github.com/ggml-org/llama.cpp.git

安装依赖

  • 根据自己情况,觉得是否需要创建虚拟环境
cd llama.cpp/gguf-pypip install --editable .

开始转换

python convert_hf_to_gguf.py xxxx(llamafacoty微调后模型地址) --outtype q8_0(量化为8)

等待转换完成即可

在ollama中使用

创建Modelfile

FROM /models/Lora-Q8-15B-Q8_0.ggufPARAMETER temperature 0.7
PARAMETER num_ctx 32768
PARAMETER num_predict 512TEMPLATE """<|im_start|>system
{{ .System }}<|im_end|>
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"
PARAMETER stop "<|endoftext|>"
PARAMETER stop "<|eot|>"PARAMETER seed 42
  • 每一种模型的模板文件都有差异,上面文件仅供参考,如果你发现ollama加载后的模型胡说八道极大可能是modelfile文件有问题

注册到ollama

ollama create qwen3:14b-ZB-Q8 -f Modelfile
  • qwen3:14b-ZB-Q8 模型的名字,可以自定义

运行模型

ollama run qwen3:14b-ZB-Q8 
http://www.dtcms.com/a/355015.html

相关文章:

  • SPARK入门
  • Python 多版本环境治理理念驱动的系统架构设计——三维治理、四级隔离、五项自治 原则(路径治理升级修订 V 2.0 版)
  • 七牛云实践:我们如何用 AIGC 将产品开发从“人想图”变为“图选图”
  • 使用astah制作专业状态图及C/C++实现解析
  • 随手小记:elementUI的勾选框使用的坑
  • 大模型微调示例五之Llama-Factory_agent_functioncalling
  • 大数据原生集群 (Hadoop3.X为核心) 本地测试环境搭建三
  • 仓颉编程语言:全场景开发的未来选择
  • SAP-ABAP:SAP HANA 架构解析:主从(Scale-Out)与主备(High Availability)架构深度对比
  • 从零开始学习JavaWeb-20
  • 架构评审:构建稳定、高效、可扩展的技术架构(上)
  • 刷题日记0828
  • AMGCL介绍和使用
  • Spark 安装教程与使用指南
  • Jetson(meta‑tegra)升级要点与 doflash.sh 组件清单
  • 嵌入式研发工程师成长路线图,基础入门 → 中级提升 → 高级进阶 → 专家方向
  • 基于 Spring AMQP 的 RabbitMQ 分布式消息系统实战
  • imx6ull-驱动开发篇47——Linux SPI 驱动实验
  • Java全栈工程师的实战面试:从基础到微服务的全面解析
  • 磁力计校准矩阵求解方法解析
  • go grpc使用场景和使用示例
  • python02
  • Codeforces Round 1043 (Div. 3) F. Rada and the Chamomile Valley
  • 02Shell的变量运算以及数据比较
  • 卷积神经网络(一):卷积神经网络基础
  • 基于卷积神经网络 (CNN) 的 MNIST 手写数字识别模型
  • 如果给我们直接创建的类加上索引?和len方法?
  • 深度学习篇---模型参数保存
  • 卷积神经网络实现mnist手写数字集识别案例
  • Apollo-PETRv1演示DEMO操作指南