当前位置: 首页 > news >正文

广州公司网站开发北京住房投资建设中心网站首

广州公司网站开发,北京住房投资建设中心网站首,服务好的网站建设公司,网站建设推广一对一服务近日,基于昇思 MindSpore AI 框架vLLM的DeepSeek-V3-0324 模型完成适配并上线魔乐社区。 作为开源AI框架,MindSpore 以其卓越的性能优化、灵活的模型开发能力和高效的分布式训练能力,为大规模模型训推部署提供全流程开源支持。通过如下步骤&a…

近日,基于昇思 MindSpore AI 框架+vLLM的DeepSeek-V3-0324 模型完成适配并上线魔乐社区。


作为开源AI框架,MindSpore 以其卓越的性能优化、灵活的模型开发能力和高效的分布式训练能力,为大规模模型训推部署提供全流程开源支持。通过如下步骤,即可快速体验昇思MindSpore版本的DeepSeek-V3-0324服务化。

魔乐社区链接:https://modelers.cn/models/MindSpore-Lab/DeepSeek-V3-0324

# 01

环境搭建

环境准备:四台Atlas 800I A2 (64G),并配置好组网,四台设备的卡与卡之间能够互相ping通。

四台设备分别拉取镜像:

docker pull hub.oepkgs.net/oedeploy/openeuler/aarch64/mindspore:20250326

四台设备分别杀进程:

ps -ef | grep python | grep -v grep | awk '{print $2}' | xargs kill -9ps -ef | grep ray | grep -v grep | awk '{print $2}' | xargs kill -9

四台设备分别启动容器,四台设备的hostname需要不同。/data/DeepSeek-V3-0324用于存放权重及yaml配置文件。

docker run -it --name=DeepSeek_V3_0324 --ipc=host --network=host --privileged=true --hostname=worker3 \        --device=/dev/davinci0 \        --device=/dev/davinci1 \        --device=/dev/davinci2 \        --device=/dev/davinci3 \        --device=/dev/davinci4 \        --device=/dev/davinci5 \        --device=/dev/davinci6 \        --device=/dev/davinci7 \        --device=/dev/davinci_manager \        --device=/dev/devmm_svm \        --device=/dev/hisi_hdc \        -v /usr/local/sbin/:/usr/local/sbin/ \        -v /var/log/npu/slog/:/var/log/npu/slog \        -v /var/log/npu/profiling/:/var/log/npu/profiling \        -v /var/log/npu/dump/:/var/log/npu/dump \        -v /var/log/npu/:/usr/slog \        -v /etc/hccn.conf:/etc/hccn.conf \        -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \        -v /usr/local/dcmi:/usr/local/dcmi \        -v /usr/local/Ascend/driver:/usr/local/Ascend/driver \        -v /etc/ascend_install.info:/etc/ascend_install.info \        -v /etc/vnpu.cfg:/etc/vnpu.cfg \        -v /data:/data \        --pids-limit 409600 \        --shm-size="250g" \        834520af4bdd \        /bin/bash

# 02

下载权重及yaml配置文件

魔乐社区权重及yaml配置文件下载:​​​​​​​

from openmind_hub import snapshot_download snapshot_download(    repo_id="MindSpore-Lab/DeepSeek-V3-0324",    local_dir="/data/DeepSeek-V3-0324",    local_dir_use_symlink=False)

yaml配置文件修改:​​​​​​​

# 修改为模型权重路径 load_checkpoint: '/data/DeepSeek-V3-0324' # 修改为模型tokenizer.json文件所在路径vocab_file: '/data/DeepSeek-V3-0324/tokenizer.json' # 修改为模型tokenizer.json文件所在路径tokenizer_file: '/data/DeepSeek-V3-0324/tokenizer.json'

# 03

启动推理服务

容器中添加环境变量:​​​​​​​

export MINDFORMERS_MODEL_CONFIG=/data/DeepSeek-V3-0324/predict_deepseek3_671b.yamlexport ASCEND_CUSTOM_PATH=$ASCEND_HOME_PATH/../export vLLM_MODEL_BACKEND=MindFormersexport vLLM_MODEL_MEMORY_USE_GB=50export ASCEND_TOTAL_MEMORY_GB=64export MS_ENABLE_LCCL=offexport HCCL_OP_EXPANSION_MODE=AIVexport HCCL_SOCKET_IFNAME=enp189s0f0export GLOO_SOCKET_IFNAME=enp189s0f0export TP_SOCKET_IFNAME=enp189s0f0export HCCL_CONNECT_TIMEOUT=3600export ASCEND_RT_VISIBLE_DEVICES=0,1,2,3,4,5,6,7

主机及辅机设置

选择一台设备作为主节点,执行如下命令:​​​​​​​

ray stopray start --head --port=6380

其他三台设备作为辅节点,依次执行如下命令:​​​​​​​

ray stopray start --address=主节点IP:6380

主节点容器中拉起服务:

python3 -m vllm_mindspore.entrypoints vllm.entrypoints.openai.api_server --model "模型权重路径" --trust_remote_code --tensor_parallel_size=32 --enable-prefix-caching --enable-chunked-prefill --max-num-seqs=256 --block-size=32 --max_model_len=70000 --max-num-batched-tokens=2048 --distributed-executor-backend=ray

发起推理服务请求,若在主节点发起请求,新开一个终端,IP地址是0.0.0.0或者localhost。

curl http://localhost:8000/v1/completions -H "Content-Type: application/jso
http://www.dtcms.com/a/591528.html

相关文章:

  • 公司手册制作网站网站生鲜建设市场分析
  • 网站开发公司市场wordpress读音
  • 怎样创建网站以及建站流程是什么网站建设源码安装教程
  • 金坛做网站哪家好会员管理系统多少钱
  • 嘉兴网站建设嘉兴网站推广如何找到外包推广公司
  • 网站设计 重庆长春地区网站建设
  • 网站后台安全密码WordPress文章投票
  • 唐山如何做百度的网站建设wordpress有什么有趣的插件
  • 昆明公司网站制作物业管理系统er图
  • 开发电子商务网站和开发新闻类网站什么异同做网站的为什么不给域名和密码
  • 官网如何被AI精准抓取?维星AI GEO优化让信息传递效率提升3倍
  • 网站建设ftpwordpress主题免费
  • 网站建设怎么入账做卷皮网类似网站
  • 网站效果检测开淘宝店要自己做网站吗
  • 个人动漫网站怎么做页面网站顶部轮播怎么做的
  • 自己做图片的网站吗wordpress图片添加字体
  • 个人手机网站动力做网站
  • 桂林生活网新闻中心保定网站关键词优化
  • 龙游做网站吉林省最新消息今天新增
  • 网站已经备案更换主机访问网站 流程图
  • 产品毕业设计代做网站产品推广方案模板
  • 网站上的地图怎么做网站建设技术方面的体会
  • 提供网站建设公wordpress一数据库多网站
  • 陕西建设厅继续教育网站企业网站 设
  • 上海网站设计网页设计百杭网络推广公司
  • 在拼多多开网店的流程优化推荐
  • 空间网站模板题库制作助手app
  • 网站建设与规划方向网站搭建技术
  • 网站的折线图怎么做seo网站关键词优化哪家好
  • 行业网站怎么做英雄联盟网站模板