当前位置: 首页 > news >正文

DeepSeek 开源了 DeepEP

DeepSeek又开源了一个超强技术:DeepEP通信库。实现了MOE之间的通信,性能更强了!

DeepEP作为全球首个专为MoE(专家混合)模型训练和推理量身定制的EP(专家并行)通信库,其诞生标志着通信技术在AI领域的又一次重大突破。

DeepEP以其卓越的性能和多样化的功能吸引了业界的广泛关注。它实现了高效的全对全(all-to-all)通信机制,不仅支持节点内部(intranode)的数据交换,还跨越节点(internode)进行通信,完美兼容NVLink和RDMA技术。这一特性确保了数据在复杂网络环境下的流畅传输。

 

在训练和推理过程中,DeepEP展现了其强大的计算能力。预填充(prefilling)阶段采用高吞吐率计算核,显著提升了数据处理速度;而在推理解码(decoding)阶段,则采用低延迟计算核,确保了实时响应的高效性。DeepEP原生支持FP8数据调度,这一低精度计算操作进一步降低了资源消耗,提升了整体性能。

快来加入交流社区

 

 

相关文章:

  • 单片机病房呼叫系统设计
  • 数据开发的简历及面试
  • 程序诗篇里的灵动笔触:指针绘就数据的梦幻蓝图
  • SV——Clocking block的应用
  • Spring Boot2.0之十 使用自定义注解、Json序列化器实现自动转换字典类型字段
  • 【Linux】Linux常用命令
  • Spring Boot 项目中如何在 `pom.xml` 文件中引入本地 JAR 包
  • 「JVS更新日志」低代码、企业会议、智能BI、智能排产2.26更新说明
  • 使用TortoiseGit配合BeyondCompare实现在Git仓库中比对二进制文件
  • QML Text部件的使用
  • JavaScript系列(90)--前端脚手架开发
  • 用Golang与WebAssembly构建高性能Web应用:详解`syscall/js`包
  • 大语言加持的闭环端到端自动驾驶模型 学习笔记纯干货
  • Linux:权限
  • pyrender 自动计算相机 pose
  • 机器学习——李航(实验)笔记第一二章
  • 电子元器件识别图大全、符号对照表
  • 【TCAD】Sentaurus 中的“陷阱trap”仿真设置
  • 对象存储之Ceph
  • halcon三维点云数据处理(二十八)reconstruct_3d_object_model_for_matching
  • 风雨天涯梦——《袁保龄公牍》发微
  • 国务院办公厅印发《国务院2025年度立法工作计划》
  • 复旦大学与上海杨浦共建市东医院
  • 沙县小吃中东首店在沙特首都利雅得开业,首天营业额5万元
  • 湛江霞山通报渔船火灾:起火船舶共8艘,无人员伤亡或被困
  • 演员发文抵制代拍获粉丝支持,媒体:追星“正确姿势”不妨多来点