当前位置: 首页 > wzjs >正文

网站开发自学要多久2023年最新新闻摘抄

网站开发自学要多久,2023年最新新闻摘抄,校园网门户网站建设,cpa建站教程从入门AI到手写Transformer-12.FFN基于位置的前馈网络 12.FFN基于位置的前馈网络代码 整理自视频 老袁不说话 。 12.FFN基于位置的前馈网络 之间讲了残差连接,规范化。 这节是FFN基于位置的前馈网络,其实就是MLP,两层线性连接层。 输入 X : …

从入门AI到手写Transformer-12.FFN基于位置的前馈网络

  • 12.FFN基于位置的前馈网络
  • 代码

整理自视频 老袁不说话 。

12.FFN基于位置的前馈网络

在这里插入图片描述
之间讲了残差连接,规范化。
这节是FFN基于位置的前馈网络,其实就是MLP,两层线性连接层。
输入 X : [ b s , n , d ] X:[bs,n,d] X:[bs,n,d]
第一层: Y = X W 1 + B 1 W 1 : [ d , d m ] Y=XW_1+B_1\quad W1:[d,d_m] Y=XW1+B1W1:[d,dm],代入 Y Y Y Y = R e L U ( X ) Y=ReLU(X) Y=ReLU(X),输出 Y : [ b s , n , d m ] Y:[bs,n,d_m] Y:[bs,n,dm]
第二层: Y = X W 2 + B 2 W 1 : [ d m , d ] Y=XW_2+B_2\quad W1:[d_m,d] Y=XW2+B2W1:[dm,d],输出 Y : [ b s , n , d ] Y:[bs,n,d] Y:[bs,n,d]

代码

import torch
from torch import nnclass FFN(nn.Module):# dm=4*ddef __init__(self,d,dm,*args,**kwargs)->None:super(FFN,self).__init__(*args,**kwargs)self.dense1=nn.Linear(d,dm) # weight:[dm,d] bias:[dm]self.relu=nn.ReLU()self.dense2=nn.Linear(dm,d) # weight:[d,dm] bias:[d]def forward(self,X):Y=self.dense1(X)Y=self.relu(Y)Y=self.dense2(Y)return YX=torch.randn(3,5,10)
ffn=FFN(10,40)
o=ffn(X)
print(o.shape)
http://www.dtcms.com/wzjs/118605.html

相关文章:

  • 免费企业网站建设介绍网络销售模式有哪些
  • 阿里云ecs部署网站seo创业
  • 武汉汉口做网站公司百度百度
  • 团购网站做二级域名山东网络推广优化排名
  • 团购网站建设外贸网站建设流程
  • 网站建设品牌好手机优化大师官方免费下载
  • dw网页设计软件的学习网站品牌运营
  • 网上自建网站开店资源搜索神器
  • 上海公司章程在哪里可以查询打印考拉seo
  • wordpress参考书宁波seo优化公司
  • 招聘网站如何做百度搜索排名查询
  • 杭州企业网站建设 哪里好性价比高seo排名
  • 企业电子商务网站的域名命名营销是做什么
  • 网站怎么怎么做关键字网推是什么
  • 网站建设制作设计seo优化南宁推广如何做网上引流
  • 整站优化加盟百度百科词条
  • 企业网络营销顾问抖音seo关键词优化
  • 张家港市凤凰镇建设局网站太原整站优化排名外包
  • 滨州j建设局网站投诉电话整站优化代理
  • 南宁网站建设怎么样站外引流推广渠道
  • 手机网站返回按钮怎么做百度小程序优化
  • 肇庆市手机网站建设品牌刷网站关键词工具
  • 做中文的云图网站seo赚钱方法大揭秘
  • 7星彩网站开发如何做市场营销推广
  • 手机做网站需要多少天十大seo免费软件
  • nanopi neo做网站seo职位具体做什么
  • 重庆疫情防控新闻发布会企业网站怎么优化
  • 企业做网站的坏处360开户推广
  • 网站设计模式有哪些快速优化官网
  • 网站收藏的链接怎么做的爱网