当前位置: 首页 > wzjs >正文

湖南网站建设网蚌埠做网站

湖南网站建设网,蚌埠做网站,网站首页轮播图怎么做,做网站怎么维护首先打开魔搭社区,然后搜索DeepSeek-R1-Distill-Qwen-7B,进入详情页 官方推荐使用vllm来启动,但是手动搭建vllm环境容易出各种问题,我们这里直接找一个vllm的Docker镜像 一、拉取镜像 docker pull vllm/vllm-openai 如果拉取不…

首先打开魔搭社区,然后搜索DeepSeek-R1-Distill-Qwen-7B,进入详情页

官方推荐使用vllm来启动,但是手动搭建vllm环境容易出各种问题,我们这里直接找一个vllm的Docker镜像

一、拉取镜像

docker pull vllm/vllm-openai

如果拉取不下来,则使用代理镜像

docker pull registry.dockermirror.com/vllm/vllm-openai
# 或者
docker pull dockerhub.icu/vllm/vllm-openai

二、下载模型

下载模型官方提供了多种下载方式,我这里喜欢使用SDK下载或者Git下载:

1、SDK下载

创建一个download_modelscope.py文件,然后内容如下:

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-7B')

执行这个文件:

python3 download_modelscope.py

默认下载到了该目录下:

:~$ ls ~/.cache/modelscope/hub/deepseek-ai/
DeepSeek-R1-Distill-Qwen-7B

 2、Git下载
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B.git

使用Git下载的前提是安装了lfs,验证是否安装lfs

git lfs install

三、创建docker容器

docker run -it --gpus all --ipc host --name deepseek-r1-7b \-v /home/defang/faiss/data/kmys_model/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B:/app/DeepSeek-R1-Distill-Qwen-7B \-v /etc/localtime:/etc/localtime:ro \-p 38805:38805 \--entrypoint /bin/bash \vllm/vllm-openai \-c "CUDA_VISIBLE_DEVICES=0,1 python3 -m vllm.entrypoints.openai.api_server --model /app/DeepSeek-R1-Distill-Qwen-7B -tp 2 --host 0.0.0.0 --max-model-len 32768 --dtype half --port 38805 --gpu-memory-utilization 0.8"
1、容器配置参数
参数说明关键点
-it交互式终端模式允许用户与容器交互(如查看日志或调试)
--gpus all启用所有GPU必须安装NVIDIA Container Toolkit
--ipc host共享宿主机IPC命名空间提升多GPU张量并行性能(避免共享内存限制)
--name deepseek-r1-7b容器命名便于后续通过 docker logs 或 docker exec 操作
-v /home/defang/...挂载模型目录宿主机模型路径必须存在,且需验证读写权限
-v /etc/localtime:ro同步宿主机时区避免容器日志时间戳混乱
-p 38805:38805端口映射确保宿主机防火墙开放该端口
--entrypoint /bin/bash覆盖默认入口点调试时常用,正式运行可移除以直接启动服务
vllm/vllm-openai镜像名称需提前通过 docker pull 获取最新版本
2、vLLM服务参数
参数说明性能影响推荐值
CUDA_VISIBLE_DEVICES=0,1指定可用GPU必须与 -tp 参数数量匹配(此处使用2卡)按实际卡号设置
--model /app/DeepSeek...模型路径需验证模型格式是否为vLLM支持的HuggingFace格式绝对路径
-tp 2张量并行度2卡并行提升吞吐量,但会增加通信开销与GPU数量一致
--host 0.0.0.0监听地址允许外部访问API服务生产环境必选
--max-model-len 32768上下文窗口影响长文本处理能力(如法律合同分析)根据模型训练长度设置
--dtype half半精度推理显存占用减少50%,速度提升20%需模型支持FP16
--gpu-memory-utilization 0.8显存使用率上限防止OOM错误,留出显存余量0.8-0.9

 四、请求验证

curl http://localhost:38805/v1/completions \-H "Content-Type: application/json" \-d '{"model": "/app/DeepSeek-R1-Distill-Qwen-7B","prompt": "Once upon a time","max_tokens": 50}'


文章转载自:

http://iQviidXR.Lnmby.cn
http://JMzB8oQs.Lnmby.cn
http://YSjLEj8b.Lnmby.cn
http://DICax403.Lnmby.cn
http://xIjylZGk.Lnmby.cn
http://XT3Qv6Fd.Lnmby.cn
http://AgZgr3co.Lnmby.cn
http://78Gvgkt1.Lnmby.cn
http://BAEGoi6e.Lnmby.cn
http://ZPD7ZkQa.Lnmby.cn
http://xeYFqJSZ.Lnmby.cn
http://rqf8ArTb.Lnmby.cn
http://zRfPQS9P.Lnmby.cn
http://bF50Cb6G.Lnmby.cn
http://olbE51GY.Lnmby.cn
http://k5o9ZGQX.Lnmby.cn
http://UNIDh9cj.Lnmby.cn
http://Klc4hUSi.Lnmby.cn
http://0PBiYsMk.Lnmby.cn
http://EaJVfeNA.Lnmby.cn
http://Eb7KjvPc.Lnmby.cn
http://G8bVmHNW.Lnmby.cn
http://RxyffwLT.Lnmby.cn
http://81WRfbj7.Lnmby.cn
http://h3KhlGVU.Lnmby.cn
http://VHzHVCC0.Lnmby.cn
http://NOFJkH42.Lnmby.cn
http://S0MBlVVf.Lnmby.cn
http://7cr7eKrO.Lnmby.cn
http://FmmxbIH2.Lnmby.cn
http://www.dtcms.com/wzjs/661845.html

相关文章:

  • 遵义市做网站的电话手机网站建设行业现状
  • 金桥路附近做网站的沈阳做网站的地方
  • 如何用模板做网站网站 切图
  • 太原市建设银行网站yande搜索引擎官网入口
  • 大型网站开发教程海外专用服务器
  • ps做网站字体用多大的wordpress可以装多少会员数据库
  • 织梦模板网站怎么上线汕头网站推广
  • 如何提高网站关键词排名东莞官方网站
  • 专业点网站制作公司企业做网络推广有什么好处
  • apache添加多个网站网页设计图片素材小插件
  • 网站建设需要哪些必备文件淄博烧烤的网络营销方式
  • 重庆网站建设cqhtwl官网用wordpress
  • 做网站ps建立多大的画布高端品销售网站
  • 济南专业做网站公司哪家好开发公司运营部职责
  • 怎样做直播网站app网站开发制作费入会计科目
  • 做视频有收益的网站做书app下载网站
  • wampserver搭建网站做交互式的网站怎么做
  • 网站开发流行营销型网站大全
  • 用什么做视频网站比较好镇江平面设计
  • 海淘网站是谁做的视频网站开发需求分析
  • 怎么用flash做网站网站建设ppt答辩
  • 云南城市建设职业学院网站网站策划编辑的工作内容
  • 漳州正规网站建设费用繁体企业网站源码
  • 北京网站排名有哪些网站是做数据展示
  • 建设工程质量网站高端的西安网页设计
  • 国外专门做视频翻译网站浙江十大外贸公司排名
  • 外包公司做网站价格重视网站建设
  • 如何利用某个软件做一个网站discuz论坛seo设置
  • 顾问完美一键优化
  • dede 网站图标互联网创业项目零成本