当前位置：首页 > news >正文

大模型推理并行

news 2025/8/22 6:52:10

参考

https://zhuanlan.zhihu.com/p/622212228

背景

目前大模型的参数以及计算量越来越大，如果放在多卡上处理成为关键，这里简单记录一下每种并行策略的概念。目前大模型核心就是gemm、FFN(MLP)、attention, 所以下面的说明也以这三个算子作为说明。

数据并行

每个gpu上储存一份模型参数，通过切分batch来实现并行推理

张量并行

gemm乘法

在这里插入图片描述
如果分到不同的gpu上的时候有两种方式：
第一种：

第二种：

FFN

原始算法：
在这里插入图片描述
并行方式：
其实就是上面两个gemm的综合：

在这里插入图片描述

查看全文

http://www.dtcms.com/a/342189.html

机器学习7

以往内容梳理--HRD与MRD

《深入探索 Java IO 流进阶：缓冲流、转换流、序列化与工具类引言》

事件驱动流程链——EPC

Metrics1：Intersection over union交并比

tail -f与less的区别

Python Excel 通用筛选函数

【C++】模板（进阶）

Rancher 管理的 K8S 集群中部署常见应用（MySQL、Redis、RabbitMQ）并支持扩缩容的操作

ubuntu编译ijkplayer版本k0.8.8（ffmpeg4.0）

Spring Boot整合Amazon SNS实战：邮件订阅通知系统开发

将windows 的路径挂载到Ubuntu上进行直接访问

C++---辗转相除法

VB.NET发送邮件给OUTLOOK.COM的用户,用OUTLOOK.COM邮箱账号登录给别人发邮件

Azure的迁移专业服务是怎么提供的

带有 Angular V14 的 Highcharts

Transformer在文本、图像和点云数据中的应用——经典工作梳理

【解决方案系列】大规模三维城市场景Web端展示方案

C++STL-stack和queue的使用及底层实现

阿里云搭建flask服务器

2021年ASOC SCI2区TOP，改进遗传算法+自主无人机目标覆盖路径规划，深度解析+性能实测

Java 16 新特性及具体应用

Redis 奇葩问题

Python break/continue

嵌入式C语言和数据结构面试题

2025-08-21 Python进阶3——模块

信创自主可控新标杆：RustFS如何用内存安全架构重构数据主权防线？

Binlog Server守护MySQL数据0丢失

RabbitMQ：技巧汇总

Windows下RabbitMQ完整安装指南

参考

背景

数据并行

张量并行

gemm乘法

FFN

相关文章：