当前位置: 首页 > wzjs >正文

海门网站制作做渲染的网站

海门网站制作,做渲染的网站,徐州网站建设xzqjw,怎么用织梦做网站后台Qwen3 已于4月29日早上发布,如何在 ZStack AIOS 上立刻体验最新的 Qwen3 模型? 由于 Qwen3 模型的支持需要较新的推理框架(vllm、sglang、llama.cpp 等底层框架),本篇文章将先向大家介绍如何一步步升级推理模板&#x…

Qwen3 已于4月29日早上发布,如何在 ZStack AIOS 上立刻体验最新的 Qwen3 模型?

图片

由于 Qwen3 模型的支持需要较新的推理框架(vllm、sglang、llama.cpp 等底层框架),本篇文章将先向大家介绍如何一步步升级推理模板,平台的管理员或者 AI 开发者在完成推理模板升级后可以共享给平台所有用户,所有用户即可无需配置立即体验最新的 Qwen3 模型。

通过 ZStack AIOS 平台,企业可以像本文所示,迅速部署和体验像 Qwen3 这样的最新 AI 模型,并将其无缝赋能给各个业务部门。这种便捷的模型部署与管理机制充分体现了 ZStack AIOS 的灵活性和产品成熟度,使得从 AI 研发到业务应用的路径显著缩短。平台的统一化管理特性确保了 IT 管理人员可以高效地控制资源分配,同时让业务部门能够根据实际需求自主访问和使用 AI 能力,进而加速企业数字化转型,助力业务创新与 AI 应用场景的高效探索和落地实践。无论是产品研发、客户服务还是内部流程优化,ZStack AIOS 都能为企业提供强有力的技术支撑。

准备环节

创建推理模板

首先进入到 ZStack AIOS 模型平台,克隆一个系统自带 SGlang 的推理模板

image.png-183.5kB


由于最新的 SGLang 版本为0.4.6.post1,因此我们将推理模板名称设置为 SGLang-0.4.6.post1,实例配置选择 “云主机”

image.png-70.2kB

配置推理镜像

下面使用一个 Qwen2.5 模型来配置这个推理模板,例如 Qwen2-0.5B 或平台内置的 Qwen2-7B 均可,主要是验证新版本 SGLang 的可用性。创建推理服务的时候推理模板选择 SGLang-0.4.6.post1:

image.png-179.5kB


启动后进入 jupyter notebook,选择 terminal,执行以下命令升级 sglang 和配套依赖:

pip install sglang[all]==0.4.6.post1 -U
wget https://bj20013.api.aliyunfile.com/v2/redirect\?id\=9b8b2fa73e484893a5f567e6be22c1921745913012094149418 -O flashinfer_python-0.2.3+cu124torch2.6-cp38-abi3-linux_x86_64.whl
pip install flashinfer_python-0.2.3+cu124torch2.6-cp38-abi3-linux_x86_64.whl
dnf -y install gcc-toolset-9-gcc gcc-toolset-9-gcc-c++echo -e "\nsource /opt/rh/gcc-toolset-9/enable" >> /etc/profile; systemctl restart zstack_ai.service

image.png-716.4kB


执行完systemctl restart zstack_ai.service之后模型服务会显示启动中,是正常的

image.png-129.5kB


稍等片刻后即可检查模型输出是否正常:

image.png-101.5kB


下面我们进入模型服务的“配置信息”页面,找到这个实例,创建一个实例镜像:

image.png-161.4kB


将云主机停止,点击创建镜像,命名为 SGLang-0.4.6.post1-image

image.png-44.9kB


然后编辑前面创建的推理模板,将推理模板所关联的云主机镜像改为刚刚封装的这个 SGLang-0.4.6.post1-image

image.png-90.7kB

image.png-189.4kB

启动 Qwen3 模型

下载模型

此时进入模型仓库,添加模型,假设我们从 ModelScope 下载,在来源选择 ModelScope,Model ID 填入我们计划使用的模型,例如 Qwen/Qwen3-14B、Qwen/Qwen3-235B-A22B 等,在推理模板选择我们刚刚新建的推理模板 SGLang-0.4.6.post1

image.png-163.8kB

运行模型

由于 14B 模型有 28GB 的权重,因此我们使用两张 22GB GPU 进行部署:

image.png-497.1kB


接下来等待启动即可,可以通过界面对话或者通过其他客户端如 chatwise 等接入测试:

image.png-238.1kB

image.png-425kB

可以看到,在 Qwen3 模型中 /think、/no_think 可以作为特殊 token 来控制是否打开思考,这极大地方便了我们在需要逻辑推理和不需要逻辑推理的时候快速进行切换。

此外,我们也可以通过服务评测对推理服务进行测试,得益于高性能的 flashinfer 后端,两张 22GB 的消费级 GPU 即可实现接近 700 的 TPS。

图片

http://www.dtcms.com/wzjs/824651.html

相关文章:

  • 爱做网站yeele网页设计案例大全
  • 什么网站做教育的比较多安卓软件开发公司收入
  • 参考网是正规网站吗注册网站域名多少钱一年
  • 佛山网站建设哪家专业建筑工程网点代表什么
  • 文章网站的一级二级怎么做重庆建设厅的网站首页
  • 直播网站app下载阳性不一定是新冠
  • 青岛网站如何制作短视频seo推广
  • 泉州网站建设设计备案域名网站大全
  • 网站seo诊断分析报告wordpress 手机适应
  • 怎么把网站做的小程序网站推广专员面试
  • 怎么在百度创建网站网络优化基础知识
  • 网站模板下载后如何使用阿里云做网站步骤
  • 旅游网官方网站制作一个网站的步骤是什么
  • 做一元购物网站网站制作多少钱一年
  • 网站代码调试国外企业画册设计网站
  • 大秦建设集团有限责任公司官方网站龙岗区做网站
  • 长春网站建设小程在线制作logo网站
  • 建设网站有哪些目的解读wordpress php代码
  • dede网站开发步骤视觉营销的网站设计
  • 哪个网站可以做蛋白质的跨膜图wordpress主机怎么建站
  • 阿里云企业网站备案wordpress 最后修改时间排序
  • 做钓鱼网站软件vip 支付wordpress
  • 石家庄手机模板建站传奇官网
  • 广州 美容 公司 网站建设360网站建设公司
  • 宁波网站关键词排名提升建设标准信息网站
  • 怎么免费建立自己网站ui设计的流程有哪些步骤
  • 上海建设工程安全质量监督站网站什么网站可以做图赚钱
  • 韩国购物网站模板哈尔滨整站
  • 哪些网站用python做的郑州百度快速排名提升
  • 网站 建设制作菜鸟教程网站顶部怎么做新浪链接