当前位置: 首页 > news >正文

本地部署项目记录【deepseek、QWQ】

1-DeepSeek

参考:【Deepseek】Linux 本地部署 Deepseek_linux部署deepseek-CSDN博客

问题:

(base) root@QiuKu_303:~/Documents/Ollama# sh ollama_install.sh >>> Cleaning up old version at /usr/local/lib/ollama >>> Installing ollama to /usr/local >>> Downloading Linux amd64 bundle ######################################################################### 100.0%

解决:【跳过问题】

export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH


2-QWQ-32B

参考:消费级显卡也能跑!QwQ-32B本地部署教程来了!【视频号】

参考:Linux环境下使用vLLM部署本地大模型_vllm加载本地模型-CSDN博客

参考:DeepSeek 部署指南 (使用 vLLM 本地部署)_vllm部署deepseek-CSDN博客

conda create -n QWQ-32B python=3.12
pip install vllm
pip install git+https://github.com/huggingface/transformers
pip install modelscope
modelscope download --model 'Qwen/QwQ-32B' --local_dir '目标目录'
vllm serve /home74/liguangzhen/folder/QwQ-32B

方案 1:使用 vLLM 部署 DeepSeek

vLLM 具有高吞吐量,支持 PagedAttention,高效利用多张 GPU。

1. 安装 vLLM

pip install vllm

pip install modelscope

2. 下载 DeepSeek 模型

拉取 DeepSeek 相关模型,例如:# 以 deepseek-ai/deepseek-llm-7b-chat 为例

modelscope download --model 'deepseek-ai/deepseek-llm-7b-chat' --local_dir '/home74/liguangzhen/folder/DeepSeek'

3. 启动 vLLM 服务器

python -m vllm.entrypoints.openai.api_server \
    --model deepseek-7b-chat \
    --tensor-parallel-size 4  # 4 张 GPU 进行张量并行
  • tensor-parallel-size 设为 4,可以让 4 张 3090 共同运行一个模型。

启动后,API 服务会运行在 http://localhost:8000/v1/completions,可以用 OpenAI API 兼容方式调用。

4. 测试 API

import requests

url = "http://localhost:8000/v1/completions"
headers = {"Content-Type": "application/json"}
data = {
    "model": "deepseek-7b-chat",
    "prompt": "请介绍一下深度学习。",
    "max_tokens": 200
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

相关文章:

  • 算法测试的2个重要指标详解
  • wordpress自定the_category的输出结构
  • 【C++】中的赋值初始化和直接初始化的区别
  • SSM架构 +java后台 实现rtsp流转hls流,在前端html上实现视频播放
  • 低代码开发直聘管理系统
  • Electron应用中获取设备唯一ID和系统信息
  • 【游戏】【客户端性能测试】
  • 【数据库系统概论】事务
  • vue 封装流动的线组件(支持实线, 虚线, 变色, 流动)
  • 企业AI数据安全白皮书:深寻模型会话保护与安当TDE实战
  • 初识CMDB:数据质量的管理
  • 责任链模式:优雅处理复杂流程的设计艺术
  • 扩展------项目中集成阿里云短信服务
  • Android Studio 一直 Loading devices
  • C++:面向对象编程(续)
  • DeepSeek DeepEP学习(二)normal notify dispatch
  • 【开源宝藏】Spring Trace 一种轻量级的日志追踪新方式
  • 第三次CCF-CSP认证(含C++源码)
  • Redis数据结构深度解析:从String到Stream的奇幻之旅(一)
  • Clion快捷键、修改字体
  • 网站建设中/平台推广渠道
  • qq网页版一键登录/上海官网seo
  • 兰溪优秀高端网站设计地址/搜索引擎seo是什么
  • 东莞长安网站设计公司/营销网站建设流程
  • wordpress做教育网站/西安官网seo技术
  • 银川住房城乡建设委官方网站/关键词点击工具