当前位置：首页 > news >正文

safetensors转为gguf，并在ollama中部署

news 2025/11/4 14:39:03

1. 模型下载

2. 开始转换hf模型为gguf，需要用|lama.cpp仓库的convert_hf_to_gguf.py脚本来转换

git clone https://github.com/ggerganov/llama.cpp.git
pip install -r llama.cpp/requirements.txt

3.执行转换

#不量化,保留模型的效果

python llama.cpp/convert_hf_to_gguf.py /mnt/workspace/.cache/modelscope/models/LLM-Research/Meta-Llama-3-8B-Instruct --outtype f16 --verbose --outfile Meta-Llama-3-8B-Instruct_f16.gguf

#需要量化(加速并有损失效果)

python llama.cpp/convert_hf_to_gguf.py /mnt/workspace/.cache/modelscope/models/LLM-Research/Meta-Llama-3-8B-Instruct --outtype q8_0 --verbose --outfile Meta-Llama-3-8B-Instruct_f16.gguf

4.启动ollama

nohup ollama serve &

5.创建Modelfile

# 基础模型：指定本地Llama 3 8B Instruct模型路径
FROM ./Meta-Llama-3-8B-Instruct_f16.gguf# 模型参数配置（根据需求调整）
# 温度值：0~1，越低回答越严谨，越高越灵活
PARAMETER temperature 0.7
# 采样范围：0~1，控制回答多样性（0.8适合大多数场景）
PARAMETER top_p 0.8
# 重复惩罚：>1 防止重复生成，1.05为轻微惩罚
PARAMETER repeat_penalty 1.05
# 停止符：遇到这些字符时停止生成（适配Llama 3格式）
PARAMETER stop <|im_end|># 对话模板（严格遵循Llama 3的<|im_start|>格式）
TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ .Response }}<|im_end|>"""# 系统提示词（定义模型角色和行为）
SYSTEM """
你是一个由Llama 3驱动的智能助手，擅长清晰、准确地回答各类问题。
- 回答需符合中文表达习惯，简洁易懂；
- 遇到不确定的内容，会明确说明“不确定”，不编造信息；
- 支持多轮对话，会结合上下文理解用户需求。
"""

6.创建自定义模型

ollama create Meta-Llama-3-8B-Instruct_f16  --file ./Modelfile

7.运行模型

 ollama run Meta-Llama-3-8B-Instruct_f16

8.open-webui界面集成使用

pip install open-webui
open-webui serve

访问端口 8080

查看全文

http://www.dtcms.com/a/566485.html

做二手车按揭的网站艺术培训机构

如何给网站做右侧导航互联网网络推广公司

公司网站优化推广宁波企业名称查询网站

做淘宝客网站服务器高新网站建设

Mysql 读书笔记

网上做任务佣金高的网站wordpress付费浏览

Flutter---卡片交换器

MAC-SQL 算法一

大连爱得科技网站建设公司怎么样在线设计平台都有哪些比较好用的

【2051】【例3.1】偶数

北京网站开发外包做网站看什么书

怎么做网站推广临沂世界网站

C# 使用XML文件保存配方数据

小说网站自主建设网站域名申请

西安谁家的集团门户网站建设比较好上海公司车牌

Spring配置数据源

Product Hunt 每日热榜 | 2025-11-02

基于图像的三维重建

越秀区做网站河南网站建设价格与方案

什么网站的新闻做参考文献中信建设有限责任公司属于央企吗

硬件工程师-基础知识（一）

都匀经济开发区建设局网站无锡电子商务网站制作

html5 input[type=date]如何让日期中的年/月/日改成英文

嘉兴城乡建设局网站株洲seo优化哪家好

【开题答辩全过程】以法律类教辅平台为例，包含答辩的问题和答案

商务网站建设哪家好免费聊天不充值软件

网站用cms 侵权免费的网站域名查询565wcc

群晖 NAS 办公套件：用Synology Calendar 高效管理日程与任务

屋领网站固链北京市小程序开发

百度商桥在网站营业执照年报入口

相关文章：