当前位置：首页 > news >正文

llama.cpp将sensor格式的大模型转化为gguf格式

news 2025/11/1 23:55:51

前言

ollama本地只能导入gguf格式的大模型文件，将safetensors 文件转化为gguf格式。需要使用 llama.cpp 这个开源工具。以下是使用 llama.cpp 转换 .safetensors 格式模型到 .gguf 格式的详细步骤:

1. 首先克隆并编译 llama.cpp:

克隆项目

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

安装依赖(Ubuntu/Debian系统为例)

sudo apt-get install python3-pip cmake

安装 Python 依赖

pip install -r requirements.txt

编译项目

make

2. 准备转换环境:

安装必要的 Python 包

pip install torch transformers safetensors sentencepiece

3. 转换模型步骤:

基本转换命令

python3 convert.py \
    --outfile 输出文件路径.gguf \
    --outtype q4_k_m \
    --model 输入模型路径

例如转换 Qwen 模型

python3 convert.py \
    --outfile qwen.gguf \
    --outtype q4_k_m \
    --model Qwen/Qwen-7B

4. 常用转换参数说明:

–outfile: 指定输出的 gguf 文件路径
–outtype: 指定量化类型,常用选项:
- q4_k_m: 4-bit 量化,平衡速度和质量
- q8_0: 8-bit 量化,更高质量但更大
- f16: 16-bit,无损但体积最大
–model: 输入模型路径

5. 注意事项:

确保有足够的磁盘空间(通常需要模型大小2-3倍的空间)
转换过程可能较慢,需要耐心等待
建议使用 GPU 进行转换,可以加快速度
转换完成后记得验证模型是否能正常工作

6. 验证转换后的模型:

使用 llama.cpp 的主程序测试

./main -m 转换后的模型.gguf -n 128
常见问题解决:

内存不足:

尝试使用更小的批处理大小
使用更激进的量化方案

转换失败:

检查模型格式是否支持
更新 llama.cpp 到最新版本
检查依赖是否完整

模型加载失败:

检查生成的 gguf 文件完整性
验证量化参数是否合适
这个过程完成后,你就可以在支持 gguf 格式的框架(如 Ollama)中使用这个模型了。

查看全文

http://www.dtcms.com/a/26780.html

「新」AI Coding(Agent) 的一点总结和看法

VisionTransformer（ViT）与CNN卷积神经网络的对比

【Linux】多线程 -＞线程互斥与死锁

java.2.19

[STM32 - 野火] - - - 固件库学习笔记 - - - 十六.在SRAM中调试代码

GITHUB的若干操作

C# 背景透明抗锯齿（效果完美）

蓝桥杯备赛1-2合法日期

深入浅出Spring Security：从入门到实战

2.19学习记录

1258：【例9.2】数字金字塔

LED灯闪烁实验：实验介绍

基于Python的Django+Hadoop民族服饰数据分析系统+毕业论文+指导搭建视频

Git是什么

DHCP详解，网络安全零基础入门到精通实战教程！

常用网络工具分析（ping，tcpdump等）

算法的解题模式Ⅲ

Python数据结构进阶：栈与队列的实现与应用

ollama使用教程

我的2025年计划

前OpenAI CTO Mira Murati创办AI新公司

迪威模型网：免费畅享 3D 打印盛宴，科技魅力与趣味创意并存

golang panic信息捕获

JavaScript数组-数组中新增元素

区块链（13）：FISCO BCOS简介及安装

智能指针讲解

深度学习与人工智能资料推荐：DeepSeek整合包全解析

智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！

大摩闭门会：250218 学习总结报告

排序算法：冒泡排序

前言