当前位置: 首页 > news >正文

openFuyao v25.09 版本正式发布!社区发行版全新升级,AI推理进一步优化

openFuyao聚焦“AI云原生”,致力于促进有效算力的极致释放,社区发行版v25.09推出多项Kubernetes增强新特性,推出完整AI推理软件套件,并对在离线混部、Cluster-API特性进行优化。感谢社区技术委员会与SIG组成员对v25.09版本做出的贡献,以下介绍具体的特性新增与变动:

openFuyao Kubernetes全新升级

SIG-orchestration-engine作为openFuyao社区核心SIG,致力于构建多样化集群的核心容器编排引擎组件。v25.09版本中,容器编排SIG推出多项Kubernetes增强,全面提升性能、运维能力和可靠性。

Kubernetes升级:1.28 → 1.33

一年一度的K8s版本焕新。

性能优化:kubelet支持服务启动时CPU垂直扩容加速Java程序启动

部分类型的应用在启动时对资源需求更高,超过稳态的limit限制,所以导致启动耗时很长,如Java、大模型推理、科学计算等。该特性能够在保障稳态较少资源占用的前提下,通过启动时CPU扩容加快应用启动速度,加速安装部署、重启、故障恢复等场景Java程序的就绪。

在资源允许的情况下,该特性对测试应用的启动速度提升可超过50%,对于部分特定应用提升可超过100%。

运维能力提升:Kubernetes证书管理增强-热加载

Kubernetes/etcd/coredns原生缺乏证书热加载能力,openFuyao Kubernetes为coredns实现了证书热加载能力,从而减少证书轮换对业务的影响。

运维能力提升:StatefulSet PVC模板支持扩容

在Kubernetes集群中,存储类基础设施使用StatefulSet类型工作负载,而随着集群业务规模的扩大,工作负载的存储空间也需要进行扩容。原生扩容方式为修改集群中StatefulSet关联的PVC对象,而该特性旨在通过修改StatefulSet规约中PVC的信息,来触发StatefulSet PVC的自动扩容,从而简化运维。

可靠性增强:日志轮转支持和可靠性增强

原生kube-log-runner只提供日志重定向能力,fuyao-log-runner对原生机制进行功能扩展,提供字节级精细日志轮转,即使日志磁盘空间不足,也能保障业务正常服务不退出;日志文件被删除时,支持自动恢复保障日志正常输出。

性能优化:容器高密部署

在高规格裸机容器场景下,单个节点会部署大量的Pod。K8s原生只支持到每节点100~300Pod,本特性实现了针对容器运行时和kubelet探针的资源消减方案,从而降低容器底座底噪和运行时开销,提升单节点部署密度到1000以上。

AI推理进一步优化

SIG-ai-inference旨在构建一个开放、高效、面向未来的云原生LLM推理加速体系,v25.09版本中,已推出完整AI推理软件套件。

最佳实践集成:AI推理软件套件

AI推理软件套件提供了AI一体机集成解决方案,初步支持基础LLM推理全栈与DeepSeek;真正做到开箱即用,硬件驱动-推理框架-推理模型全链路打通,现提供NPU卡或GPU卡部分型号的驱动支持。

此外,目前已启动孵化AI推理加速特性,将提供AI推理场景下的端到端加速解决方案,包含智能路由模块、推理后端模块、全局KV Cache管理模块,实现推理吞吐量提升和时延降低,为AI服务部署提供高效、可靠的技术支撑。

在离线混部&Cluster-API特性优化

在离线混部:Qos保障能力提升

在离线混部v25.09进一步提升了QoS保障能力,通过集成rubik弹性限流、内存异步分级回收等多项能力,在维持30~50%资源利用率提升的同时进一步降低QoS波动。与此同时,SIG-colocation组织了结构化代码重构,简化仓库架构,提升代码质量。

Cluster-API:安装方式优化

SIG-installation为版本带来全新的安装体验:

  • 离线安装包制作更简单:通过配置可选择性附带扩展组件离线安装包。

  • 安装规格更轻量:支持引导节点和管理集群共部署,只有1个节点也可以创建集群

参考链接:https://docs.openfuyao.cn/docs/

http://www.dtcms.com/a/470634.html

相关文章:

  • 世界标准日:关于 “标准”
  • 从671B到70B,如何用更低成本实现企业大模型工程化的RAG、Agent与微调落地,大模型入门到精通,收藏这篇就足够了!
  • 给网站添加关键词流行的wordpress主题
  • 深入理解epoll_data数据关联机制:四种方式详解与实践指南
  • m3u8格式在直播场景中的应用
  • 医疗门户网站管理系统在线营销推广
  • 积分非线性(INL)和微分非线性(DNL)的含义与联系
  • JavaSE面向对象(上)
  • 光的礼赞:探索自然界中的神奇之光
  • 一个企业网站的建设流程微信小程序商城收费吗
  • C++核心语法精要指南
  • 网站中弹出广告怎么做的腾讯官方网站做书签
  • 国外优秀的设计网站公司要做seo
  • 丰台体育馆网站建设WordPress批量修改文章
  • 计算机操作系统:进程同步
  • 怎么制作网站封面建设网站的视频
  • 为什么做网站要有自己的服务器做网站自己租服务器还是网络公司
  • DeepSeek vs ChatGPT 技术架构、成本与场景全解析
  • java开发三层架构下的分层解耦
  • 缔客网络上海响应式网站建设如何建平台网站
  • 学习Java第三十七天——黑马点评61~68
  • 网站 运营 外包 每个月多少钱h5制作易企秀
  • 基础算法:滑动窗口
  • 数据比例与尺度:如何避免让图“放大”差异
  • 《动手学深度学习v2》学习笔记 | 3.4-3.7 softmax 回归
  • Python驱动的无人机多光谱-点云融合技术在生态三维建模与碳储量、生物量、LULC估算中的全流程实战
  • 哪些网站收录排名好wordpress 获取title
  • 大语言模型核心技术解析:从 Transformer 架构到下词预测的完整工作原理与编码器、解码器及注意力机制的运作流程
  • 企业网站模板建站怎么用上海平台公司
  • Android Maven私服搭建(Windows)