当前位置: 首页 > news >正文

如何手动使用下载并且运行 QwQ-32B-GGUF

首先使用安装

pip install ModelScope

使用 ModelScope 下载对应的模型

modelScope download --model Qwen/QwQ-32B-GGUF qwq-32b-q4_k_m.gguf

第二步开始下载 ollama

git clone https://githubfast.com/ggerganov/llama.cpp # githubfast.com 可以加速下载

切换到目录,并且新增编译目录

mkdir build 
cd build 

开始设置编译,根据不同的系统架构可以选择不同的编译指令

cd build 
# CPU 编译
cmake .. -DCMAKE_BUILD_TYPE=Release

# NVIDIA GPU 加速:
cmake .. -DCMAKE_BUILD_TYPE=Release -DLLAMA_CUDA=ON
# Apple Silicon 加速:
cmake .. -DCMAKE_BUILD_TYPE=Release -DLLAMA_METAL=ON

开始编译

 make -j$(nproc)

查询是否编译成功

# 查询是否编译成功,存在表示编译成功
ls -lh bin/llama-run

存在表示成功

可以运行模型

./bin/llama-run /mnt/workspace/.cache/modelscope/models/Qwen/QwQ-32B-GGUF/qwq-32b-q4_k_m.gguf

http://www.dtcms.com/a/69467.html

相关文章:

  • 文件上传安全
  • 大数据-spark3.5安装部署之standalone模式
  • 数据结构:栈的应用举例——进制转换
  • ACwing—跳台阶(bfs+dp+递归+记忆化搜索算法)
  • SpringBoot中使用AJ-Captcha实现行为验证码(滑动拼图、点选文字)
  • C语言零基础入门:嵌入式系统开发之旅
  • windows下安装docker desktop并指定安装目录及汉化
  • 系统可观测性(5)OpenTelemetry基础使用
  • Kotlin 继承
  • 银河麒麟V10ServerSP3中Redis7源码编译与安装详细教程
  • SQL basic commands
  • 【go】函数类型的作用
  • 【数控系统】第二章 LinuxCNC源码介绍
  • TCP/IP 协议精讲-精华总结版本
  • 【SpringMVC】入门版
  • 网络运维学习笔记(DeepSeek优化版) 016 HCIA-Datacom综合实验01
  • Apache Shiro反序列化漏洞深度剖析:从原理到利用
  • PostgreSQL的学习心得和知识总结(一百七十一)|深入理解PostgreSQL数据库之 外连接消除 的使用和实现
  • pytest自动化测试[面试篇]
  • linux sentos7 遗忘root用户密码
  • VMware虚拟机安装Windows10系统配置docker容器
  • MacOS 15.3.1 安装 GPG 提示Error: unknown or unsupported macOS version: :dunno
  • 单片机—中断系统
  • Linux之进程控制
  • HTML5-基础知识
  • CentOS 6 YUM源切换成国内yum源
  • 适合企业内训的AI工具实操培训教程(37页PPT)(文末有下载方式)
  • 优艾智合加码具身智能赛道,“一脑多态”技术矩阵率先规模化落地
  • vue3 中使用 Recorder 实现录音并上传,并用Go语言调取讯飞识别录音(Go语言)
  • HAL库STM32常用外设—— CAN通信(一)