当前位置: 首页 > news >正文

本地部署 deepseek-r1 1.5B方法-ubuntu20.04 python3.10 pycharm虚拟环境

1. 环境安装

ubuntu20.04 

python3.10

pycharm虚拟环境

2.拉取代码

虚拟环境下安装vllm

pip install vllm

ubuntu命令窗口安装 sudo apt install git-lfs

初始化 Git LFS 安装 Git LFS 后,你需要虚拟环境命令窗口初始化它:git lfs install

拉取代码

git lfs install git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

如果大文件没有拉取成功,在仓库路径下手动拉取大文件:git lfs pull

如果大文件还是没有拉取成功,直接复制后放在正确位置即可。

3、 使用 vLLM 启动推理服务

现在,我们可以使用 vLLM 启动推理服务。

 vllm serve /home/terrycao/PycharmProjects/deepseek/DeepSeek-R1-Distill-Qwen-1.5B \
>     --tensor-parallel-size 1 \
>     --max-model-len 8192 \
>     --enforce-eager \
>     --gpu-memory-utilization 0.7 \
>     --swap-space 4 \
>     --disable-log-stats
 

4、订阅服务

import requests
import json

# 设置 API 服务器地址
url = "http://0.0.0.0:8000/v1/completions"

# 构造请求数据
data = {
    "model": "/home/terrycao/PycharmProjects/deepseek/DeepSeek-R1-Distill-Qwen-1.5B",
    "prompt": "你的身份是一个名为DeepSeek的大型语言模型,请用中文介绍一下你自己。",
    "max_tokens": 100,
    "temperature": 0.1,
    "top_p": 0.9
}


# 发送 POST 请求
response = requests.post(url, json=data)

# 打印完整的返回数据
print("Full Response:", response.json())

# 检查是否有生成的文本
result = response.json()
if "choices" in result and len(result["choices"]) > 0:
    print("Generated Text:", result["choices"][0]["text"])
else:
    print("Error: No text generated")

5、结果

/home/terrycao/PycharmProjects/deepseek/venv/bin/python /home/terrycao/PycharmProjects/deepseek/test.py
Full Response: {'id': 'cmpl-4e5f61fa865349df844980cdfd7d4d69', 'object': 'text_completion', 'created': 1740559537, 'model': '/home/terrycao/PycharmProjects/deepseek/DeepSeek-R1-Distill-Qwen-1.5B', 'choices': [{'index': 0, 'text': '请以简短的句子回答。\n</think>\n\n我是DeepSeek-R1,一个由深度求索公司开发的大型语言模型。我擅长通过思考来帮您解答复杂的数学,代码和逻辑推理等理工类问题。', 'logprobs': None, 'finish_reason': 'stop', 'stop_reason': None, 'prompt_logprobs': None}], 'usage': {'prompt_tokens': 17, 'total_tokens': 66, 'completion_tokens': 49, 'prompt_tokens_details': None}}
Generated Text: 请以简短的句子回答。
</think>

我是DeepSeek-R1,一个由深度求索公司开发的大型语言模型。我擅长通过思考来帮您解答复杂的数学,代码和逻辑推理等理工类问题。

Process finished with exit code 0

相关文章:

  • QEMU源码全解析 —— 内存虚拟化(21)
  • Elasticsearch 的分布式架构原理:通俗易懂版
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_destroy_pool 函数
  • mmdetection框架下使用yolov3训练Seaships数据集
  • 【Bug】natten:安装报错(临近注意力机制的高效cuda内核实现)
  • Ubuntu+deepseek+Dify本地部署
  • Kubernetes 资源利用率翻倍?离在线混合部署深度解析
  • 进程间的通信(消息队列和共享信息)
  • Docker 部署 MinIO 对象存储服务
  • 核货宝订货系统助力东南亚国家批发贸易企业数字化转型升级
  • 【Java】Spring Boot全量YAML配置说明
  • Java在云计算平台中的应用研究
  • 扩增子测序|R包microeco妙用之零模型计算群落确定性和随机性过程(NST,pNST,βNTI,RCbray生态过程计算)
  • Springboot 自动化装配的原理
  • Oracle 12c Docker安装问题排查 sga_target 1536M is too small
  • Mysql基础-多表查询(详细版)
  • MySQL安装多版本与版本切换
  • C语言文件操作函数详解
  • Dify部署无法拉取镜像
  • Leaflet介绍及使用示例
  • 体坛联播|赵心童晋级世锦赛决赛,德布劳内一球制胜
  • 澳大利亚联邦选举投票正式开始
  • 燕子矶:物流网络中的闪亮节点|劳动者的书信②
  • “五一”假期首日迎出游高峰:火车站人流“堪比春运”,热门景区门票预订量同比增三成
  • 超越梅罗,这样一个亚马尔折射巴萨的容错率
  • 解放日报:“北斗七星”列阵,AI群星闪耀