当前位置: 首页 > news >正文

部署|Llama-Facory微调模型部署

前言

  前面记录了llama-factorry微调大模型的各种参数,现在记录一下基于ollama部署llama-factory微调模型的两种方法,如果没有嫌麻烦的话可以直接看第二种方法,快速部署。

1 方法1,使用llama-cpp

1.1 下载llama-cpp

conda create -n llama-cpp python=3.10
conda activate llama-cpp
git clone https://github.com/ggml-org/llama.cpp.git
pip install -r requirements.txt

如下图所示,git下来之后是这个样子的:
在这里插入图片描述

1.2 转换模型到guff

cd llama.cpp
python convert_hf_to_gguf.py --outfile xxx/xxx/model.gguf E:\PyPro\chatbot\LLaMA-Factory\saves\Qwen2.5-0.5B\full\chatbot1024_e5v4

如下图所示,转化出来的模型是这个样子的:
在这里插入图片描述

1.3 编写Modelfile

在你的模型同级目录下编写Modelfile,如下图所示:
在这里插入图片描述
里面的内容为:

FROM ./chatbot.gguf

PARAMETER num_ctx 1024
PARAMETER temperature 0.95
PARAMETER top_p 0.7

TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>{{ end }}<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""

这里chatbotdy可以改成你的模型名称。
其中Modefile的可选参数有:
在这里插入图片描述
具体详细解释可以看这里:链接
这里重点记录一下TEMPLATE
先去llama-factory官网去看你的模板是什么:
在这里插入图片描述
如上图所示,我用的是qwen2.5模板为qwen,然后去ollama官网去找相应模型的TEMPLATE:
在这里插入图片描述
点开之后是这样:
在这里插入图片描述
将其复制下来即可。

1.4 加载进ollama

ollama这里就不赘述,如果不知道怎么安装的,可以看我以前的文章:Windows| DeepSeek最简单的本地部署方法
这里直接敲命令:

# 也可以直接在上述目录中直接cmd进入目录
cd path_to_ggufpath
ollama create chatbot -f ./Modelfile

这里chatbot为你的模型名称。
如下图所示,这样就算成功添加模型到ollama:
在这里插入图片描述
如果不想要了,可以删除模型:

ollama rm model_name

2 方法2,使用Llama-Factory(推荐)

2.1 打开webui

llamafactory-cli webui

2.2 使用webui的Export功能

在这里插入图片描述

2.3 使用ollama加载模型

进入导出目录直接cmd进入中断命令行界面,然后输入一下命令:

# chatbot_e5为你给模型起的名字
ollama create chatbot_e5 -f ./Modelfile

如图所示:
在这里插入图片描述

总结

本文介绍了如何将llama-factory微调后的大模型通过ollama部署的两种方法,第一种方法有模型兼容问题,具体可以去官网查看兼容哪种模型,所以推荐第二种方法。

相关文章:

  • element-plus中Dropdown下拉菜单组件的使用
  • word插入Mathtype公式居中和自动更新
  • PairRE: Knowledge Graph Embeddings via Paired Relation Vectors(论文笔记)
  • 八股学习-JUC java并发编程
  • svn-1.7.22安装
  • ESP8266通过AT指令配置双向透传
  • C++常用多线程模式
  • 【病毒分析】伪造微软官网+勒索加密+支付威胁,CTF中勒索病毒解密题目真实还原!
  • 机器学习面试重点第二部分(动画版)
  • 服务创造未来 东隆科技携多款产品亮相慕尼黑
  • Idea中使用Git插件_合并当前分支到master分支_冲突解决_很简单---Git工作笔记005
  • Debezium + Kafka-connect 实现Postgres实时同步Hologres
  • Spring Boot配置与注解的使用
  • Leetcode 1277. 统计全为 1 的正方形子矩阵 动态规划
  • 【C++】动态规划从入门到精通
  • PH2D数据集: 用人类演示数据提升人形机器人操作能力,助力跨实体学习
  • Java并发(知识整理)
  • 在 Hugging Face Spaces 上使用 Gradio 免费运行 ComfyUI 工作流
  • 前后端Vue 跨越端口问题解决
  • Ollama + Open WebUI 本地部署DeepSeek
  • 公司做网站需准备资料/品牌运营策略有哪些
  • 东营网站建设铭盛信息/软文之家
  • 网站在线聊天代码/营销推广的主要方式
  • 微网站模板前后台/网络营销专业怎么样
  • 初二怎么做网站/互联网宣传方式有哪些
  • 网站建设 美橙/优化科技