当前位置: 首页 > news >正文

Mlp-Mixer-BiGRU故障诊断的python代码合集

     

    谈起 MLP-Mixer 之前,我们先了解一下 MLP 结构,即多层感知机(Multi-layer Perceptrons),理论上一定复杂程度的 MLP 可以拟合任何函数的,但是代价是大量的计算开销和参数量,这给纯 MLP 的模型发展造成了阻碍。之前提出的 CNN、RNN 就是通过将 Inductive Bias(归纳偏置) 引入模型里,从而能在计算资源有限、数据有限的情况下能取得很好的结果。

不管怎么说,MLP-Mixer 证明了古老结构 MLP 的能力,视觉领域形成了 MLP --> CNN --> Transformer --> MLP 的轮回,一时间后续很多基于 MLP 的工作如雨后竹笋般频出,如 ResMLP、CycleMLP、gMLP、ViP、ConvMLP 等。

流程解析

我们来看一下 MLP-Mixer 的总体结构把,这里我们直接看代码来理解;

     

  部分核心代码:

class PatchEmbed(nn.Layer):""" Patch Embedding Layer"""def __init__(self,img_size=224,patch_size=16,in_chans=3,embed_dim=768,norm_layer=None,flatten=True,):super().__init__()img_size = (img_size, img_size)patch_size = (patch_size, patch_size)self.img_size = img_sizeself.patch_size = patch_sizeself.grid_size = (img_size[0] // patch_size[0],img_size[1] // patch_size[1])self.num_patches = self.grid_size[0] * self.grid_size[1]self.flatten = flattenself.proj = nn.Conv2D(in_chans,embed_dim,kernel_size=patch_size,stride=patch_size)self.norm = norm_layer(embed_dim) if norm_layer else Identity()def forward(self, x):B, C, H, W = x.shapeassert (H == self.img_size[0]), f"Input image height ({H}) doesn't match model ({self.img_size[0]})."assert (W == self.img_size[1]), f"Input image width ({W}) doesn't match model ({self.img_size[1]})."x = self.proj(x)if self.flatten:x = x.flatten(2).transpose([0, 2, 1])  # BCHW -> BNCx = self.norm(x)return x

      本代码在Mlp-Mixer算法的基础上融合Bigru,构成了Mlp-Mixer-BiGRU新型算法。该算法基于pytorch,数据来源为公开轴承数据集。数据集上,本模型表现良好。MLP-MIXER和MLP-MIXER-BIGRU两者置于同一合集中,供大家学习使用。

  希望对大家有所帮助,需要的朋友欢迎关注共重号:年轻的战场ssd,回复 Mlp-Mixer-BiGRU   。一起交流,学习进步!!!

相关文章:

  • 2025抓包工具Reqable手机抓包HTTPS亲测简单好用-快速跑通
  • 互联网大厂Java面试:从Spring Boot到微服务架构的深度探讨
  • 协程:单线程并发开发的高效利器
  • 谷歌官网下载谷歌浏览器设置中文
  • 使用Redission来实现布隆过滤器
  • C++ asio网络编程(8)处理粘包问题
  • Ubuntu---omg又出bug了
  • Python_day29类的装饰器知识点回顾
  • 王树森推荐系统公开课 排序02:Multi-gate Mixture-of-Experts (MMoE)
  • oracle 资源管理器的使用
  • Java IO及Netty框架学习小结
  • 游戏服务器之聊天频道设计
  • YOLOv5目标构建与损失计算
  • C#里与嵌入式系统W5500网络通讯(2)
  • (二十一)Java集合框架源码深度解析
  • 推理大模型与普通大模型的区别是什么?
  • 程序代码篇---ESP32的数据采集
  • Fine-Tuning Llama2 with LoRA
  • imx6ULL从应用程序到驱动程序
  • 【图像处理基石】OpenCV中都有哪些图像增强的工具?
  • 减负举措如何助力基层干部轻装上阵?记者一线调查
  • 十大券商看后市|A股指数有望进一步缓步推高,淡化短期波动
  • 上海公办小学验证今起开始,下周一和周二分区进行民办摇号
  • 蒲慕明院士:未来数十年不是AI取代人,而是会用AI的人取代不会用的
  • 中国人民银行等四部门联合召开科技金融工作交流推进会
  • 奥运“四朝元老”华天回国参赛,伤势未愈谨慎出战全国锦标赛