当前位置: 首页 > wzjs >正文

阿里巴巴批发网站上面怎么做微商第三方网站流量统计

阿里巴巴批发网站上面怎么做微商,第三方网站流量统计,wordpress 数字交易,网站不备案不能访问吗《OpenShift / RHEL / DevSecOps 汇总目录》 说明:本文已经在 OpenShift 4.18 OpenShift AI 2.19 的环境中验证 文章目录 什么是 ModelCar构建模型镜像在 OpenShift AI 使用模型镜像部署模型扩展速度对比 参考 什么是 ModelCar KServe 典型的模型初始化方法是从 S…

《OpenShift / RHEL / DevSecOps 汇总目录》
说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证

文章目录

  • 什么是 ModelCar
  • 构建模型镜像
  • 在 OpenShift AI 使用模型镜像
    • 部署模型
    • 扩展速度对比
  • 参考

什么是 ModelCar

KServe 典型的模型初始化方法是从 S3 Bucket 获取模型。由于每次初始化都要下载模型文件,这一过程对于小型模型来说是可行的,但对于大型模型来说就成了性能瓶颈,因为在自动扩展的过程中会大大延迟启动时间。

ModelCar 是 KServe 为应对这一问题的方案,它具备以下突出优势:

  • 模型文件已放在容器镜像中,当镜像在节点中已被缓存的时候,可避免重复下载模型文件,从而可显著减少模型启动的延迟。
  • 因为在节点上运行相同模型的 pod 将访问同一镜像,无需在每个 pod 中下载模型数据,因此可减少本地磁盘空间的使用。

构建模型镜像

  1. 创建下载模型的文件 download_model.py。
$ cat > download_model.py << EOF
from huggingface_hub import snapshot_download# Specify the Hugging Face repository containing the model
model_repo = "Qwen/Qwen2.5-0.5B-Instruct"
snapshot_download(repo_id=model_repo,local_dir="/models",allow_patterns=["*.safetensors", "*.json", "*.txt"],
)
EOF
  1. 创建构建镜像的文件 Containerfile。
$ cat > Containerfile << EOF
FROM registry.access.redhat.com/ubi9/python-311:latest as baseUSER rootRUN pip install huggingface-hub# Download the model file from hugging face
COPY download_model.py .RUN python download_model.py # Final image containing only the essential model files
FROM registry.access.redhat.com/ubi9/ubi-micro:9.4# Copy the model files from the base container
COPY --from=base /models /modelsUSER 1001
EOF
  1. 构建包含模型的镜像。
podman build . -t modelcar-example:latest --platform linux/amd64
  1. 将镜像推送到 Registry。
$ podman images localhost/modelcar-example
REPOSITORY                  TAG         IMAGE ID      CREATED         SIZE
localhost/modelcar-example  latest      ae4aac72bb2c  59 minutes ago  1.02 GB$ podman push localhost/modelcar-example quay.io/your-registry/modelcar-example:latest

在 OpenShift AI 使用模型镜像

部署模型

  1. 按下图创建一个使用镜像作为源的 connection。
    在这里插入图片描述
  2. 使用以上 connection 部署模型。将 Deployment mode 设为 Advanced,即使用 Serverless 运行模型;Number of model server replicas to deploy 设为 0,即初始运行副本数为零。
    在这里插入图片描述

扩展速度对比

结合《OpenShift AI - 在 OpenShift 和 OpenShift AI 上运行 LLM》中基于 S3 的模型部署模式,在同一环境中对 ModelCar 和 S3 方式运行的 ibm-granite/granite-3.2-2b-instruct 模型进行同时扩展。测试结果:

  • ModelCar 模式的扩展时间:1分12秒,明显快。
  • S3 模式的扩展时间:2分22秒。

参考

https://developers.redhat.com/articles/2025/01/30/build-and-deploy-modelcar-container-openshift-ai#modelcar_containers_pros_and_cons
https://github.com/redhat-ai-services/modelcar-catalog
https://opendatahub.io/docs/serving-models/
https://github.com/redhat-ai-services/modelcar-catalog/tree/main/modelcar-images/qwen2.5-0.5b-instruc

http://www.dtcms.com/wzjs/420153.html

相关文章:

  • seo网站优化软件日照seo公司
  • 网站开发数据库设计网络优化这个行业怎么样
  • 网站现在一般做多大尺寸泰安网站优化公司
  • 网站建设具备什么条件网页游戏推广平台
  • wordpress中文章标题经典seo伪原创
  • 做网站设计都需要什么软件2023年6月份疫情严重吗
  • h5页面怎么做seo零基础培训
  • 有服务器和域名怎么做网站百度营销中心
  • 棋牌网站开发需要多少钱汽车seo是什么意思
  • 网站后台信息管理怎么做黄页网络的推广软件
  • 做网站网页需要什么软件互联网平台推广是什么意思
  • 关于戒烟网站怎么做seo优化有哪些
  • 检测网站是用什么代码做的软件小红书推广价目表
  • 陕西省建设厅网站官网推广产品的软文怎么写
  • 陕西省诚信建设示范网这个网站免费建立自己的网站
  • 赚钱链接网站网页设计与制作代码成品
  • wordpress增加友情链接灯塔网站seo
  • 请人做网站 出现纠纷怎么办南宁网络推广平台
  • 在线网站代码生成种子资源
  • 东莞网站建设 少儿托管百度搜索引擎的网址是
  • 泸州网站开发公司百度广告联盟app
  • 怎么在阿里云上做网站网络推广技术外包
  • 帮别人做诈骗网站技术青岛seo服务公司
  • 网站建设实训步骤百度推广平台
  • 辽宁seo站内优化郑州关键词排名公司电话
  • 国外网站素材搜索推广是什么意思
  • 网站开发技术实验教程杭州seo建站
  • 天津专业网站设计报价十大跨境电商erp排名
  • 长治网站制作怎么做今天热搜前十名
  • 鄂州城乡建设委员会网站刷关键词的平台