当前位置: 首页 > news >正文

12.FFN基于位置的前馈网络

从入门AI到手写Transformer-12.FFN基于位置的前馈网络

  • 12.FFN基于位置的前馈网络
  • 代码

整理自视频 老袁不说话 。

12.FFN基于位置的前馈网络

在这里插入图片描述
之间讲了残差连接,规范化。
这节是FFN基于位置的前馈网络,其实就是MLP,两层线性连接层。
输入 X : [ b s , n , d ] X:[bs,n,d] X:[bs,n,d]
第一层: Y = X W 1 + B 1 W 1 : [ d , d m ] Y=XW_1+B_1\quad W1:[d,d_m] Y=XW1+B1W1:[d,dm],代入 Y Y Y Y = R e L U ( X ) Y=ReLU(X) Y=ReLU(X),输出 Y : [ b s , n , d m ] Y:[bs,n,d_m] Y:[bs,n,dm]
第二层: Y = X W 2 + B 2 W 1 : [ d m , d ] Y=XW_2+B_2\quad W1:[d_m,d] Y=XW2+B2W1:[dm,d],输出 Y : [ b s , n , d ] Y:[bs,n,d] Y:[bs,n,d]

代码

import torch
from torch import nnclass FFN(nn.Module):# dm=4*ddef __init__(self,d,dm,*args,**kwargs)->None:super(FFN,self).__init__(*args,**kwargs)self.dense1=nn.Linear(d,dm) # weight:[dm,d] bias:[dm]self.relu=nn.ReLU()self.dense2=nn.Linear(dm,d) # weight:[d,dm] bias:[d]def forward(self,X):Y=self.dense1(X)Y=self.relu(Y)Y=self.dense2(Y)return YX=torch.randn(3,5,10)
ffn=FFN(10,40)
o=ffn(X)
print(o.shape)

相关文章:

  • 中华传承-医山命相卜-易经
  • Linux MySQL版本升级(rpm安装方式)
  • 嵌入式开发--STM32G4系列硬件CRC支持MODBUS和CRC32
  • mybatisFlex各种链式sql写法
  • 深度比较Gemini 2.5两款最新模型差异
  • Python基础知识语法归纳总结(数据类型-1)
  • python_level1.2
  • Android模块编译无法找到依赖(shared_libs)
  • 【Vue3代理机制详解:从原理到实践】
  • LeadeRobot具身智能应用标杆:无人机X柔韧具身智能,空中精准作业游刃有余
  • 6. 实战(二):用Spring AI+OpenAI构建企业级智能客服
  • STM32学习2
  • 自学新标日第十九课复习版本
  • 驱动移植【简略版】
  • Vue3中provide和inject的用法示例
  • 第 4 期:DDPM中的损失函数——为什么只预测噪声?
  • 守护进程及gdb调试(新手简略版)
  • 数控铣床自动上下料机械手控制装置设计
  • python豆包语音合成并播放
  • keil5软件配置以及使用技巧
  • 广东省副省长刘红兵跨省调任湖南省委常委、宣传部长
  • 这就是上海!
  • 农业农村部:把住能繁母猪存栏量“总开关”,引导养殖场户优化母猪存栏结构、合理控制产能
  • 原创话剧风向标!这个展演上《大宅门》《白鹿原》先后上演
  • 京东美团开打,苦了商家?
  • 价格周报|猪价继续回暖:二次育肥热度仍存,对猪价仍有一定支撑