当前位置: 首页 > news >正文

01-简单几步!在Windows上用llama.cpp运行DeepSeek-R1模型

在这里插入图片描述

1.llama.cpp介绍

Llama.cpp 是一个开源的、轻量级的项目,旨在实现 Meta 推出的开源大语言模型 Llama 的推理(inference)。Llama 是 Meta 在 2023 年开源的一个 70B 参数的高质量大语言模型,而 llama.cpp 是一个用 C++ 实现的轻量化推理端解决方案,适用于运行和测试 Llama 模型。

特点

1.轻量化:llama.cpp 是一个非常轻量级的项目,代码简洁且易于编译,适合快速上手和测试。
2.开源:完全开源,代码和模型权重都可以自由获取和使用。
3.支持多种模型:支持 Llama 的不同版本(如 7B、14B、30B、70B 参数量),用户可以根据需求选择。
4.跨平台:支持在多种操作系统(如 Linux、Windows、macOS)上运行。
5.易于集成:代码结构简单,适合开发者快速集成到自己的项目中。

应用场景

  • 个人项目:开发者可以快速使用 Llama 模型进行文本生成、对话机器人等实验。
  • 教育和研究:适合学习和研究大语言模型的实现和应用。
  • 小规模部署:对于小型项目或个人用途,llama.cpp 提供了一个方便的解决方案。

2.编译llama.cpp

2.1 环境准备

  • 安装cmake:https://cmake.org/download/
  • 安装visual studio 2022
  • 安装git

2.2 编译llama.cpp

确保环境准备ok,就可以执行下述命令进行编译了!

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
mkdir build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64
cmake --build . --config Release -- /m

编译成功后,这里生成了很多成果物,后面我们就要用其中的一些来运行我们的模型。
在这里插入图片描述

3.运行模型

运行模型前需要下载好模型文件,llama.cpp支持gguf格式的模型文件。我们可以去huggineface上面下载。下面是一个比较小的模型,有多个不同的量化版本,下载其中一个就行。
下载页面如下:https://huggingface.co/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/tree/main

3.1 命令模式

使用llama-cli.exe来运行模型,命令如下(记住要换成模型文件的实际路径):

./llama-cli -m "C:\Users\51559\AppData\Local\nomic.ai\GPT4All\DeepSeek-R1-Distill-Qwen-14B-Q4_0.gguf"

上述命令执行后,就可以愉快地玩耍了~
在这里插入图片描述

3.2 服务模式

如果你觉得命令模式运起来不舒服,可以用服务模式,服务模式会运行一个web,可以直接在web上进行对话。

./llama-server -m "C:\Users\51559\AppData\Local\nomic.ai\GPT4All\DeepSeek-R1-Distill-Qwen-14B-Q4_0.gguf" --port 8080


当我们看到上面的输出后,就可以在浏览器通过这个地址进行对话了:http://127.0.0.1:8080/
在这里插入图片描述

好了,deepseek-r1模型就在本地部署起来了。但是我们今天使用的是cpu,如果你下载的模型比较大,而你的电脑配置又比较差,可能运行起来不是那么流畅。
下一节,我来教大家如何使用本地GPU,让模型更加流畅地运行!

相关文章:

  • 计算机毕业设计SpringBoot+Vue.js制造装备物联及生产管理ERP系统(源码+文档+PPT+讲解)
  • FFmpeg-chapter7和chapter8-使用 FFmpeg 解码视频(原理篇和实站篇)
  • 【2024_CUMCM】图论模型
  • SwanLab简明教程:从萌新到高手
  • NO.30十六届蓝桥杯备战|C++输入输出|单组测试用例|多组测试用例|isalpha|逗号表达式(C++)
  • C语言-语法
  • vocabulary is from your listening,other speaking and your thought.
  • 如何借助人工智能AI模型开发一个类似OpenAI Operator的智能体实现电脑自动化操作?
  • 什么是美颜SDK?从几何变换到深度学习驱动的美颜算法详解
  • 免费AI图片生成工具推荐
  • 005-获取内存占用率
  • C运算符 对比a++、++a、b--、 --b
  • 【数据结构】后序线索二叉树找前驱、后继
  • 计算机毕业设计SpringBoot+Vue.js车辆管理系统(源码+文档+PPT+讲解)
  • PDFelement Pro v11.4.8.3352 万兴PDF国际解锁版 下载
  • 【Academy】HTTP Host 标头攻击 ------ HTTP Host header attacks
  • 关于C++数据类型char的类型是整数的思考
  • K8S单机部署
  • 中级网络工程师面试题参考示例(1)
  • filter_var()函数用于过滤和验证用户输入的数据
  • 手机版网站建设开发/中国时事新闻网
  • 网站建设价格a去找真甲先生/百度首页纯净版怎么设置
  • 做网站费用列入什么科目/网页优化包括什么
  • 做网站的论文摘要/网络营销品牌推广
  • 网站建设 代理/百度指数大数据
  • 提供网站制作/如何优化网络环境