当前位置: 首页 > news >正文

LLMFactory导出的Merge模型导入ollama

  • 背景
    LLaMA-Factory 导出的是 HuggingFace 格式模型,Ollama 要的是 GGUF 格式模型。两者结构完全不一样,不能直接通用。

1. 用 llama.cpp 工具把 safetensors 转成 gguf

进入你的 llama.cpp 或 LLaMA-Factory 目录(包含这个脚本的目录):

cd path/to/your/llama-factory-or-llama.cpp-folder

2. 用 Python 执行转换脚本:

python convert_hf_to_gguf.py D:/models/Qwen1.5-1.8B-Chat-huanhuan --outfile D:/models/Qwen1.5-1.8B-Chat-huanhuan/qwen.gguf

3. 检查本文件夹下是否已经有了gguf和modelfile文件:

在这里插入图片描述

4.开始运行

在 Modelfile 所在目录运行以下命令(确保在 llama_env 激活状态):

ollama create qwen1.5-huanhuan -f Modelfile

5. 启动模型交互

ollama run qwen1.5-huanhuan
http://www.dtcms.com/a/284605.html

相关文章:

  • 从平面到时空:地图故事的时空叙事与沉浸式阅读
  • 征程 6 UCP 任务优先级 抢占简介与实操
  • Qt5 与 Qt6 详细对比
  • .NET 8.0 使用 WebSocket
  • 24、鸿蒙Harmony Next开发:不依赖UI组件的全局自定义弹出框 (openCustomDialog)
  • 趋势分析:从数据波动中读懂产品的 “健康信号”
  • 使用 docker 安装 openldap
  • JMeter在Linux命令行模式下执行的核心参数及使用场景,结合官方文档与实战经验整理,便于快速查阅
  • 【软件开发】Copilot 编码插件
  • demComponent
  • Java常用命令汇总
  • 中兴B860AV5.1-M2_S905L3SB最新完美版线刷包 解决指示灯异常问题
  • 微服务网站开发学习路线与RuoYi-Cloud实战指南
  • Spring Boot 监控:AOP vs Filter vs Java Agent
  • BI 数据可视化平台建设(3)—首页性能提升实践
  • ThinkPHP8 Windows开发全流程:从搭建到上线
  • 【Android代码】绘本翻页时通过AI识别,自动通过手机/pad朗读绘本
  • MTK平台--如何查询手机连接的TX速率和带宽
  • Android本地浏览PDF(Android PDF.js 简要学习手册)
  • [MRCTF2020]PYWebsite
  • 大语言模型任务分解与汇总:从认知瓶颈到系统化解决方案
  • ubuntu基础搭建
  • 学习笔记(39):结合生活案例,介绍 10 种常见模型
  • Matplotlib 轴标题与刻度字号调整方法
  • 渗透总结一
  • docker中 contriner 和 images 什么关系
  • Oracle 成本优化器(CBO)与数据库统计信息:核心原理与实践
  • 深度学习计算图学习路线
  • Python获取网页乱码问题终极解决方案 | Python爬虫编码处理指南
  • UE5 lumen