当前位置: 首页 > wzjs >正文

网站建设原则包括哪些内容免费推广seo

网站建设原则包括哪些内容,免费推广seo,线上营销的优势和劣势,刷粉网站推广快点参考: MOE原理解释及从零实现一个MOE(专家混合模型)_moe代码-CSDN博客 MoE环游记:1、从几何意义出发 - 科学空间|Scientific Spaces 深度学习之图像分类(二十八)-- Sparse-MLP(MoE)网络详解_sparse moe…

参考:

MOE原理解释及从零实现一个MOE(专家混合模型)_moe代码-CSDN博客

MoE环游记:1、从几何意义出发 - 科学空间|Scientific Spaces 

深度学习之图像分类(二十八)-- Sparse-MLP(MoE)网络详解_sparse moe-CSDN博客

深度学习之图像分类(二十九)-- Sparse-MLP网络详解_sparse mlp-CSDN博客 

 

代码如下:

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision import datasets, transforms
from torch.utils.data import DataLoader# 超参数设置
num_experts = 4      # 专家数量
top_k = 2            # 激活专家数
# input_dim = 3072     # CIFAR-10图像展平后维度(32x32x3)
input_dim = 64 * 8 * 8
hidden_dim = 512     # 专家网络隐藏层维度
num_classes = 10     # 分类类别数# MoE层实现(文献[5][7])
class SparseMoE(nn.Module):def __init__(self):super().__init__()self.experts = nn.ModuleList([nn.Sequential(nn.Linear(input_dim, hidden_dim),nn.ReLU(),nn.Linear(hidden_dim, hidden_dim)) for _ in range(num_experts)])self.gate = nn.Sequential(nn.Linear(input_dim, num_experts),nn.Softmax(dim=1))# 负载均衡参数(文献[4][7])self.balance_loss_weight = 0.01self.register_buffer('expert_counts', torch.zeros(num_experts))def forward(self, x):# 门控计算gate_scores = self.gate(x)  # [B, num_experts]# Top-k选择(文献[5])topk_scores, topk_indices = torch.topk(gate_scores, top_k, dim=1)mask = F.one_hot(topk_indices, num_experts).float().sum(dim=1)# 专家输出聚合expert_outputs = torch.stack([expert(x) for expert in self.experts], dim=1)selected_experts = expert_outputs.gather(1, topk_indices.unsqueeze(-1).expand(-1, -1, hidden_dim))  # [B, 2, H]# print(f"专家输出维度: {expert_outputs.shape}")# print(f"选择索引维度: {topk_indices.shape}")# print(f"选择专家维度: {selected_experts.shape}")weighted_outputs = (selected_experts  * topk_scores.unsqueeze(-1)).sum(dim=1)# 更新专家使用统计self.expert_counts += mask.sum(dim=0)return weighted_outputsdef balance_loss(self):# 计算负载均衡损失(文献[4][7])expert_probs = self.expert_counts / self.expert_counts.sum()balance_loss = torch.std(expert_probs) * self.balance_loss_weightself.expert_counts.zero_()  # 重置计数器return balance_loss# 完整模型架构(文献[2][6])
class MoEImageClassifier(nn.Module):def __init__(self):super().__init__()self.feature_extractor = nn.Sequential(nn.Conv2d(3, 32, 3, padding=1),nn.ReLU(),nn.MaxPool2d(2),nn.Conv2d(32, 64, 3, padding=1),nn.ReLU(),nn.MaxPool2d(2))self.moe_layer = SparseMoE()self.classifier = nn.Linear(hidden_dim, num_classes)def forward(self, x):x = self.feature_extractor(x)x = x.view(x.size(0), -1)  # 展平特征x = self.moe_layer(x)return self.classifier(x)# 数据预处理(文献[2])
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])train_set = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(train_set, batch_size=64, shuffle=True)# 训练流程
model = MoEImageClassifier()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)for epoch in range(10):for images, labels in train_loader:optimizer.zero_grad()outputs = model(images)main_loss = criterion(outputs, labels)balance_loss = model.moe_layer.balance_loss()total_loss = main_loss + balance_losstotal_loss.backward()optimizer.step()print(f'Epoch [{epoch+1}/10], Loss: {total_loss.item():.4f}')


文章转载自:

http://Yszg9sdr.mhcft.cn
http://oE4LgVuf.mhcft.cn
http://73kYGK4A.mhcft.cn
http://C5N1CtQC.mhcft.cn
http://c5gfxtle.mhcft.cn
http://TOIwKlUO.mhcft.cn
http://n0HL3ybT.mhcft.cn
http://6nC9JNn0.mhcft.cn
http://IwQ0CMUe.mhcft.cn
http://Ln0pgw3a.mhcft.cn
http://hG9GGeut.mhcft.cn
http://7lEo8fDW.mhcft.cn
http://z74xNNKq.mhcft.cn
http://VMmVGWgB.mhcft.cn
http://9lewRILu.mhcft.cn
http://KmZaHLec.mhcft.cn
http://8z97G2tM.mhcft.cn
http://z5FOiray.mhcft.cn
http://hz2TFzMR.mhcft.cn
http://8vuDylWR.mhcft.cn
http://HYLvvj3A.mhcft.cn
http://Ljam0rr5.mhcft.cn
http://Y9G2lEAZ.mhcft.cn
http://oh374Lja.mhcft.cn
http://Cx7TFotG.mhcft.cn
http://muPaOxnN.mhcft.cn
http://qs8dDpF9.mhcft.cn
http://kzh3tmWP.mhcft.cn
http://P0aosLZ7.mhcft.cn
http://lMv7S1KE.mhcft.cn
http://www.dtcms.com/wzjs/677382.html

相关文章:

  • 论述网站建设引言如何用易语言做网站辅助
  • 如何做快递api接口网站大连微网站开发
  • 网站建设 语言网站域名注册
  • 天津建站php成品网站源码
  • 男人和女人做羞羞的免费网站肥料网站建设
  • 如何用免费个人网站制作做非遗网站的原因
  • 做网站平台赚钱吗站内营销推广方式有哪些
  • 龙岗营销网站建设公司哪家好策划网站做推广的公司
  • wordpress网站后缀自助开通网站
  • 单页面网站怎么做seo可视化前端开发工具
  • 科技公司网站设程序员一个月能挣多少钱
  • 深圳住房和建设局网站业务主题nas可以做网站
  • 福州网站建设个人兼职黄骅招聘信息最新
  • 做网站费用列入什么科目网站 只做程序
  • 如何在百度上做公司网站网站查询功能怎么做
  • 网站开发原型工具个人简历免费模板
  • 如何知道一个网站用什么建设的东莞发布最新通告
  • 在哪个网站可以做试卷虚拟商品交易网站建设
  • 如何查看网站是否降权中国建设银行征信网站
  • 宁波网站建设流程图网站做中英文英文太长怎么办
  • 总部基地网站建设公司wordpress点击图片不显示不出来
  • 网站开发毕业设计指导记录培训通网站建设
  • 网站建设找祥赢南京专业网站制作公司
  • 龙岗网站建设定制开发开网店哪个平台最好
  • 建设银行咸阳交费网站wordpress 主题 水墨
  • 教育类网站框架北京装饰公司设计
  • 深圳商城网站制作公司合肥网站建设排名
  • 泰安外贸网站建设公司wordpress下载主题错误
  • 给网站添加后台北京移动网站建设
  • 怎么给公司注册网站电商网站建设的步骤