LLMFactory导出的Merge模型导入ollama
- 背景
LLaMA-Factory 导出的是 HuggingFace 格式模型,Ollama 要的是 GGUF 格式模型。两者结构完全不一样,不能直接通用。
1. 用 llama.cpp 工具把 safetensors 转成 gguf
进入你的 llama.cpp 或 LLaMA-Factory 目录(包含这个脚本的目录):
cd path/to/your/llama-factory-or-llama.cpp-folder
2. 用 Python 执行转换脚本:
python convert_hf_to_gguf.py D:/models/Qwen1.5-1.8B-Chat-huanhuan --outfile D:/models/Qwen1.5-1.8B-Chat-huanhuan/qwen.gguf
3. 检查本文件夹下是否已经有了gguf和modelfile文件:
4.开始运行
在 Modelfile 所在目录运行以下命令(确保在 llama_env 激活状态):
ollama create qwen1.5-huanhuan -f Modelfile
5. 启动模型交互
ollama run qwen1.5-huanhuan