当前位置：首页 > news >正文

HuggingFace的SafeSensor格式模型能转成Ollama格式的吗？

news 2025/7/2 3:22:26

文章目录

- - **步骤 1：准备工作**
  - **步骤 2：将 SafeTensor 转换为 PyTorch 格式**
  - **步骤 3：将 PyTorch 模型转换为 GGUF 格式**
  - **步骤 4：配置 Ollama**
  - **注意事项**

将 Hugging Face 上的 SafeTensor 格式模型（.safetensors）转换为 Ollama 支持的格式（通常是 GGUF 格式）需要以下步骤。以下是详细流程：

步骤 1：准备工作

安装依赖库：

pip install safetensors transformers torch llama-cpp-python

下载模型：
- 从 Hugging Face 下载模型文件（包括 model.safetensors 和 config.json）。
- 示例（以 Llama 2 为例）：
```
git clone https://huggingface.co/meta-llama/Llama-2-7b-hf
```

步骤 2：将 SafeTensor 转换为 PyTorch 格式

加载模型并保存为 PyTorch 格式：

from transformers import AutoModelForCausalLM
import torchmodel = AutoModelForCausalLM.from_pretrained("path/to/model_directory",use_safetensors=True  # 自动加载 .safetensors 文件
)
model.save_pretrained("converted_model", safe_serialization=False)  # 保存为 PyTorch 格式（.bin）

步骤 3：将 PyTorch 模型转换为 GGUF 格式

使用 llama.cpp 转换工具：

克隆 llama.cpp 仓库：

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make

将 PyTorch 模型转换为 GGUF：

python3 convert.py --input "path/to/converted_model" --output "output_model.gguf" --vocab-type bpe

如果需要量化（减小模型大小）：

./quantize "output_model.gguf" "output_model-Q4_K_M.gguf" Q4_K_M

步骤 4：配置 Ollama

创建 Ollama Modelfile：

FROM ./output_model-Q4_K_M.gguf
PARAMETER temperature 0.7
PARAMETER num_ctx 4096
# 添加其他自定义参数

构建 Ollama 模型：
```
ollama create my-model -f Modelfile
```
运行模型：
```
ollama run my-model
```

注意事项

模型架构兼容性：
- 确保原始模型架构（如 Llama、Mistral）与 llama.cpp 兼容。
- 非主流架构可能需要手动调整转换参数。
量化策略：
- 推荐使用 Q4_K_M 或 Q5_K_M 平衡精度和速度。
文档参考：
- llama.cpp 官方文档
- Ollama Modelfile 配置

如果遇到问题，建议检查模型架构是否被支持，或通过 Hugging Face 社区和 Ollama GitHub Issues 寻求帮助。

查看全文

http://www.dtcms.com/a/189355.html

26、测试咒语：魔法校验—— Jest+Testing Lib

SimpleAdmin云服务器发布

浅聊一下数据库的索引优化

19.Excel数据透视表：第2部分数据透视计算

生产级编排AI工作流套件：Flyte全面使用指南 — Core concepts

需求管理缺乏持续改进机制，如何建立

计算机视觉----时域频域在图像中的意义、傅里叶变换在图像中的应用、卷积核的频域解释

黑白浮生项目测试报告

【入门】纸盒的最大体积是多少？

docker部署WeDataSphere开源大数据平台

redis数据结构-10（ZREM、ZSCORE、ZINCRBY）

以价值为导向的精准数据治理实践，赋能业务决策

移动端前端开发调试工具/webkit调试工具/小程序调试工具WebDebugX使用教程

第十五届蓝桥杯国赛Python A组题解

【认知思维】沉没成本谬误：为何难以放弃已投入的资源

山东大学软件学院计算机图形学2025期末考题回忆版

使用bitNet架构

普通IT的股票交易成长史--20250513复盘

CAN（控制器局域网络）协议详解

Confusion2（Python反序列化+JWT）

【前端】【JavaScript】【总复习】四万字详解JavaScript知识体系

【数据结构】栈

【MyBatis-8】MyBatis对象关联查询详解：高效处理复杂关系映射

Altium Designer AD如何输出PIN带网络名的PDF装配图

内存中的“BANK”

深入理解Python逻辑判断、循环与推导式（附实战案例）

Shell脚本与Xshell的使用、知识点、区别及原理

演员评论家算法

缺乏需求变更的影响评估，如何降低项目风险

Linux操作系统之进程（一）：进程属性与进程创建