当前位置：首页 > news >正文

LLMFactory导出的Merge模型导入ollama

news 2025/7/18 8:35:42

背景
LLaMA-Factory 导出的是 HuggingFace 格式模型，Ollama 要的是 GGUF 格式模型。两者结构完全不一样，不能直接通用。

1. 用 llama.cpp 工具把 safetensors 转成 gguf

进入你的 llama.cpp 或 LLaMA-Factory 目录（包含这个脚本的目录）：

cd path/to/your/llama-factory-or-llama.cpp-folder

2. 用 Python 执行转换脚本：

python convert_hf_to_gguf.py D:/models/Qwen1.5-1.8B-Chat-huanhuan --outfile D:/models/Qwen1.5-1.8B-Chat-huanhuan/qwen.gguf

3. 检查本文件夹下是否已经有了gguf和modelfile文件：

在这里插入图片描述

4.开始运行

在 Modelfile 所在目录运行以下命令（确保在 llama_env 激活状态）：

ollama create qwen1.5-huanhuan -f Modelfile

5. 启动模型交互

ollama run qwen1.5-huanhuan

查看全文

http://www.dtcms.com/a/284605.html

从平面到时空：地图故事的时空叙事与沉浸式阅读

征程 6 UCP 任务优先级抢占简介与实操

Qt5 与 Qt6 详细对比

.NET 8.0 使用 WebSocket

24、鸿蒙Harmony Next开发：不依赖UI组件的全局自定义弹出框 (openCustomDialog)

趋势分析：从数据波动中读懂产品的 “健康信号”

使用 docker 安装 openldap

JMeter在Linux命令行模式下执行的核心参数及使用场景，结合官方文档与实战经验整理，便于快速查阅

【软件开发】Copilot 编码插件

demComponent

Java常用命令汇总

中兴B860AV5.1-M2_S905L3SB最新完美版线刷包解决指示灯异常问题

微服务网站开发学习路线与RuoYi-Cloud实战指南

Spring Boot 监控：AOP vs Filter vs Java Agent

BI 数据可视化平台建设（3）—首页性能提升实践

ThinkPHP8 Windows开发全流程：从搭建到上线

【Android代码】绘本翻页时通过AI识别，自动通过手机/pad朗读绘本

MTK平台--如何查询手机连接的TX速率和带宽

Android本地浏览PDF（Android PDF.js 简要学习手册）

[MRCTF2020]PYWebsite

大语言模型任务分解与汇总：从认知瓶颈到系统化解决方案

ubuntu基础搭建

学习笔记(39):结合生活案例，介绍 10 种常见模型

Matplotlib 轴标题与刻度字号调整方法

渗透总结一

docker中 contriner 和 images 什么关系

Oracle 成本优化器（CBO）与数据库统计信息：核心原理与实践

深度学习计算图学习路线

Python获取网页乱码问题终极解决方案 | Python爬虫编码处理指南

UE5 lumen

1. 用 llama.cpp 工具把 safetensors 转成 gguf

2. 用 Python 执行转换脚本：

3. 检查本文件夹下是否已经有了gguf和modelfile文件：

4.开始运行

5. 启动模型交互

相关文章：