当前位置: 首页 > wzjs >正文

湖南网站模板建站seo关键词优化推广报价多少钱

湖南网站模板建站,seo关键词优化推广报价多少钱,沃尔玛商城,房产网站程序首先打开魔搭社区,然后搜索DeepSeek-R1-Distill-Qwen-7B,进入详情页 官方推荐使用vllm来启动,但是手动搭建vllm环境容易出各种问题,我们这里直接找一个vllm的Docker镜像 一、拉取镜像 docker pull vllm/vllm-openai 如果拉取不…

首先打开魔搭社区,然后搜索DeepSeek-R1-Distill-Qwen-7B,进入详情页

官方推荐使用vllm来启动,但是手动搭建vllm环境容易出各种问题,我们这里直接找一个vllm的Docker镜像

一、拉取镜像

docker pull vllm/vllm-openai

如果拉取不下来,则使用代理镜像

docker pull registry.dockermirror.com/vllm/vllm-openai
# 或者
docker pull dockerhub.icu/vllm/vllm-openai

二、下载模型

下载模型官方提供了多种下载方式,我这里喜欢使用SDK下载或者Git下载:

1、SDK下载

创建一个download_modelscope.py文件,然后内容如下:

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-7B')

执行这个文件:

python3 download_modelscope.py

默认下载到了该目录下:

:~$ ls ~/.cache/modelscope/hub/deepseek-ai/
DeepSeek-R1-Distill-Qwen-7B

 2、Git下载
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.git

使用Git下载的前提是安装了lfs,验证是否安装lfs

git lfs install

三、创建docker容器

docker run -it --gpus all --ipc host --name deepseek-r1-7b \-v /home/defang/faiss/data/kmys_model/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B:/app/DeepSeek-R1-Distill-Qwen-7B \-v /etc/localtime:/etc/localtime:ro \-p 38805:38805 \--entrypoint /bin/bash \vllm/vllm-openai \-c "CUDA_VISIBLE_DEVICES=0,1 python3 -m vllm.entrypoints.openai.api_server --model /app/DeepSeek-R1-Distill-Qwen-7B -tp 2 --host 0.0.0.0 --max-model-len 32768 --dtype half --port 38805 --gpu-memory-utilization 0.8"
1、容器配置参数
参数说明关键点
-it交互式终端模式允许用户与容器交互(如查看日志或调试)
--gpus all启用所有GPU必须安装NVIDIA Container Toolkit
--ipc host共享宿主机IPC命名空间提升多GPU张量并行性能(避免共享内存限制)
--name deepseek-r1-7b容器命名便于后续通过 docker logs 或 docker exec 操作
-v /home/defang/...挂载模型目录宿主机模型路径必须存在,且需验证读写权限
-v /etc/localtime:ro同步宿主机时区避免容器日志时间戳混乱
-p 38805:38805端口映射确保宿主机防火墙开放该端口
--entrypoint /bin/bash覆盖默认入口点调试时常用,正式运行可移除以直接启动服务
vllm/vllm-openai镜像名称需提前通过 docker pull 获取最新版本
2、vLLM服务参数
参数说明性能影响推荐值
CUDA_VISIBLE_DEVICES=0,1指定可用GPU必须与 -tp 参数数量匹配(此处使用2卡)按实际卡号设置
--model /app/DeepSeek...模型路径需验证模型格式是否为vLLM支持的HuggingFace格式绝对路径
-tp 2张量并行度2卡并行提升吞吐量,但会增加通信开销与GPU数量一致
--host 0.0.0.0监听地址允许外部访问API服务生产环境必选
--max-model-len 32768上下文窗口影响长文本处理能力(如法律合同分析)根据模型训练长度设置
--dtype half半精度推理显存占用减少50%,速度提升20%需模型支持FP16
--gpu-memory-utilization 0.8显存使用率上限防止OOM错误,留出显存余量0.8-0.9

 四、请求验证

curl http://localhost:38805/v1/completions \-H "Content-Type: application/json" \-d '{"model": "/app/DeepSeek-R1-Distill-Qwen-7B","prompt": "Once upon a time","max_tokens": 50}'

http://www.dtcms.com/wzjs/792876.html

相关文章:

  • 建站网站软件8网站建设方面的文章
  • 做靓号网站单页面网站教程
  • 海商网英文网站广西南宁网站建设哪家好
  • 孝昌县专注网站建设代理百度seo关键词优化方案
  • 网站开发公司成都asp.net网站后台源码
  • 有一个可以做任务的网站公司网络维护具体做什么
  • 嘉兴企业做网站免费建站网站一级大录像不卡
  • 外包公司的业务员seo工程师招聘
  • 网站死链接怎么删除网站系统升级中
  • 南山网站建设方案书做宠物网站还有前景嘛
  • 市桥网站建设培训学校百度站长平台官网
  • 平台网站做等级保护测评电子商务网站建设的一般过程
  • e4a做网站软件建设区块链网站
  • 按颜色分类的网页设计欣赏网站关于公司网站建设
  • 云南电商网站开发认证网站源码
  • 国外论文类网站有哪些免费建站软件有哪些
  • 搭建网站一般多少钱wordpress 配置邮件
  • 要怎样夸一个网站做的好看好的网站建设技术
  • 做网站需要有公司吗视频网站开发用什么服务器
  • 做网站ssl证书必须要吗wordpress教程破解版
  • 做网站前怎么建立数据结构替老外做网站
  • 网站开发开票内容新开传奇网站合击
  • .net 网站开发书籍青岛做网络推广的公司有哪些
  • 网站做sem推广时要注意什么东莞网站推广优化建设
  • vue做直播网站dw下载手机版
  • 建设小型网站价钱cent7安装wordpress
  • 打开一张图片后点击跳转到网站怎么做的手机网站设计推荐
  • 网站建设费科目属于无形资产么互联网网站如何做流量统计
  • 哪里有建设网站的七牛云最新消息
  • aspcms网站地图生成wordpress默认后台密码