当前位置：首页 > news >正文

把llamafacoty微调后的模型导出ollama模型文件

news 2025/8/29 6:46:25

按照llama.cpp.git

git clone https://github.com/ggml-org/llama.cpp.git

安装依赖

根据自己情况，觉得是否需要创建虚拟环境

cd llama.cpp/gguf-pypip install --editable .

开始转换

python convert_hf_to_gguf.py xxxx(llamafacoty微调后模型地址) --outtype q8_0(量化为8)

等待转换完成即可

在ollama中使用

创建Modelfile

FROM /models/Lora-Q8-15B-Q8_0.ggufPARAMETER temperature 0.7
PARAMETER num_ctx 32768
PARAMETER num_predict 512TEMPLATE """<|im_start|>system
{{ .System }}<|im_end|>
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"
PARAMETER stop "<|endoftext|>"
PARAMETER stop "<|eot|>"PARAMETER seed 42

每一种模型的模板文件都有差异，上面文件仅供参考，如果你发现ollama加载后的模型胡说八道极大可能是modelfile文件有问题

注册到ollama

ollama create qwen3:14b-ZB-Q8 -f Modelfile

qwen3:14b-ZB-Q8 模型的名字，可以自定义

运行模型

ollama run qwen3:14b-ZB-Q8

查看全文

http://www.dtcms.com/a/355015.html

SPARK入门

Python 多版本环境治理理念驱动的系统架构设计——三维治理、四级隔离、五项自治原则（路径治理升级修订 V 2.0 版）

七牛云实践：我们如何用 AIGC 将产品开发从“人想图”变为“图选图”

使用astah制作专业状态图及C/C++实现解析

随手小记：elementUI的勾选框使用的坑

大模型微调示例五之Llama-Factory_agent_functioncalling

大数据原生集群 (Hadoop3.X为核心) 本地测试环境搭建三

仓颉编程语言：全场景开发的未来选择

SAP-ABAP:SAP HANA 架构解析：主从（Scale-Out）与主备（High Availability）架构深度对比

从零开始学习JavaWeb-20

架构评审：构建稳定、高效、可扩展的技术架构（上）

刷题日记0828

AMGCL介绍和使用

Spark 安装教程与使用指南

Jetson（meta‑tegra）升级要点与 doflash.sh 组件清单

嵌入式研发工程师成长路线图，基础入门 → 中级提升 → 高级进阶 → 专家方向

基于 Spring AMQP 的 RabbitMQ 分布式消息系统实战

imx6ull-驱动开发篇47——Linux SPI 驱动实验

Java全栈工程师的实战面试：从基础到微服务的全面解析

磁力计校准矩阵求解方法解析

go grpc使用场景和使用示例

python02

Codeforces Round 1043 (Div. 3) F. Rada and the Chamomile Valley

02Shell的变量运算以及数据比较

卷积神经网络（一）：卷积神经网络基础

基于卷积神经网络 (CNN) 的 MNIST 手写数字识别模型

如果给我们直接创建的类加上索引？和len方法？

深度学习篇---模型参数保存

卷积神经网络实现mnist手写数字集识别案例

Apollo-PETRv1演示DEMO操作指南

按照llama.cpp.git

安装依赖

开始转换

等待转换完成即可

在ollama中使用

创建Modelfile

注册到ollama

运行模型

相关文章：