当前位置: 首页 > wzjs >正文

大红门做网站的公司google adsense

大红门做网站的公司,google adsense,360做的网站,怎样成立一个网站DeepSpeed是由微软开发的开源深度学习优化框架,专注于大规模模型的高效训练与推理。其核心目标是通过系统级优化技术降低显存占用、提升计算效率,并支持千亿级参数的模型训练。 官网链接:deepspeed 训练代码下载:git代码 一、De…

DeepSpeed是由微软开发的开源深度学习优化框架,专注于大规模模型的高效训练与推理。其核心目标是通过系统级优化技术降低显存占用、提升计算效率,并支持千亿级参数的模型训练。

官网链接:deepspeed
训练代码下载:git代码

一、DeepSpeed的核心作用

  1. 显存优化与高效内存管理

    • ZeRO(Zero Redundancy Optimizer)技术:通过分片存储模型状态(参数、梯度、优化器状态)至不同GPU或CPU,显著减少单卡显存占用。例如,ZeRO-2可将显存占用降低8倍,支持单卡训练130亿参数模型。
      在这里插入图片描述

    • Offload技术:将优化器状态卸载到CPU或NVMe硬盘,扩展至TB级内存,支持万亿参数模型训练。

    • 激活值重计算(Activation Checkpointing):牺牲计算时间换取显存节省,适用于长序列输入。

  2. 灵活的并行策略

    • 3D并行:融合数据并行(DP)、模型并行(张量并行TP、流水线并行PP),支持跨节点与节点内并行组合,适应不同硬件架构。

    • 动态批处理与梯度累积:减少通信频率,支持超大Batch Size训练。

  3. 训练加速与混合精度支持

    • 混合精度训练:支持FP16/BF16,结合动态损失缩放平衡效率与数值稳定性。

    • 稀疏注意力机制:针对长序列任务优化,执行效率提升6倍。

    • 通信优化:支持MPI、NCCL等协议,降低分布式训练通信开销。

  4. 推理优化与模型压缩

    • 低精度推理:通过INT8/FP16量化减少模型体积,提升推理速度。

    • 模型剪枝与蒸馏:压缩模型参数,降低部署成本。


二、与pytorch 对比分析

1. 优势

  • 显存效率:相比PyTorch DDP,单卡80GB GPU可训练130亿参数模型(传统方法仅支持约10亿)。

  • 并行灵活性:支持3D并行组合,优于Horovod(侧重数据并行)和Megatron(侧重模型并行)。

  • 生态集成:与Hugging Face Transformers、PyTorch无缝兼容,简化现有项目迁移。

  • 全流程覆盖:同时优化训练与推理,而vLLM仅专注推理优化。

2. 局限性

  • 配置复杂度:分布式训练需手动调整通信策略和分片参数,学习曲线陡峭(需编写JSON配置文件)。

  • 硬件依赖:部分高级功能(如ZeRO-Infinity)依赖NVMe硬盘或特定GPU架构。

  • 推理效率:纯推理场景下,vLLM的吞吐量更高(连续批处理优化更专精)。


三、训练用例

1、ds_config.json(deepspeed执行训练时,使用的配置文件)
  • deepspeed训练模型时,不需要在代码中定义优化器,只需要在 json 文件中进行配置即可, json文件内容如下:
{"train_batch_size": 128, //所有GPU上的 单个训练批次大小 之和"gradient_accumulation_steps": 1, //梯度累积 步数"optimizer": {"type": "Adam", //选择的 优化器"params": {"lr": 0.00015 //相关学习率大小}},"zero_optimization": { //加速策略"stage":2}
}

2、训练函数

  • 将模型包装成 deepspeed 形式
#将模型 包装成 deepspeed 形式
model_engine, _, _, _ = deepspeed.initialize(args=args,model=model,model_parameters=model.parameters())
  • 使用 deepspeed 包装后的模型 进行 反向传播和梯度更新
#使用 deepspeed 进行 反向传播和梯度更新
#反向传播
model_engine.backward(loss)#梯度更新
model_engine.step()
  • 完整训练代码如下:
'''
使用命令行进行启动启动命令如下:
deepspeed ds_train.py --epochs 10 --deepspeed --deepspeed_config ds_config.json
'''import argparse
import torch
import torchvision
import deepspeed
from model_definition import load_data, CustomModelif __name__ == '__main__':#读取命令行 传递的参数parser = argparse.ArgumentParser()parser.add_argument("--local_rank", help = "local device id on current node", type = int, default=0)parser.add_argument("--epochs", type = int, default=1)parser = deepspeed.add_config_arguments(parser)args = parser.parse_args()#获取数据集train_loader, test_loader = load_data() #数据集加载器中的 batch_size的大小 = (ds_config.json中 train_batch_size/gpu数量)#获取原始模型model = CustomModel().cuda()#将模型 包装成 deepspeed 形式model_engine, _, _, _ = deepspeed.initialize(args=args,model=model,model_parameters=model.parameters())loss_fn = torch.nn.CrossEntropyLoss().cuda() # 损失函数(分类任务常用)for i in range(args.epochs):for inputs, labels in train_loader:#前向传播inputs = inputs.cuda()labels = labels.cuda()outputs = model_engine(inputs)loss = loss_fn(outputs, labels)#使用 deepspeed 进行 反向传播和梯度更新#反向传播model_engine.backward(loss)#梯度更新model_engine.step()model_engine.save_checkpoint('./ds_models', i)#模型保存torch.save(model_engine.module.state_dict(),'deepspeed_train_model.pth')
3、模型评估

import argparse
import torch
import torchvision
import deepspeed
from model_definition import load_data, CustomModel
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
import numpy as np
import matplotlib.pyplot as plt# 1. 定义数据转换(预处理)
transform = transforms.Compose([transforms.ToTensor(),          # 转为Tensor格式(自动归一化到0-1)transforms.Normalize((0.1307,), (0.3081,))  # 标准化(MNIST的均值和标准差)
])test_data = datasets.MNIST(root='./data',train=False,          # 测试集transform=transform)#获取数据集
train_loader, test_loader = load_data()model = CustomModel()
model.load_state_dict(torch.load('deepspeed_train_model.pth'))#评估
model.eval()  # 设置为评估模式
correct = 0
total = 0with torch.no_grad():  # 不计算梯度(节省内存)for images, labels in test_loader:images, labels = images, labelsoutputs = model(images)_, predicted = torch.max(outputs.data, 1)  # 取概率最大的类别total += labels.size(0)correct += (predicted == labels).sum().item()print(f"测试集准确率: {100 * correct / total:.2f}%")# 随机选择一张测试图片
index = np.random.randint(0,1000)  # 可以修改这个数字试不同图片
test_image, true_label = test_data[index]
test_image = test_image.unsqueeze(0)  # 增加批次维度# 预测
with torch.no_grad():output = model(test_image)
predicted_label = torch.argmax(output).item()print(f"预测: {predicted_label}, 真实: {true_label}")# 显示结果
plt.imshow(test_image.cpu().squeeze(), cmap='gray')
plt.title(f"预测: {predicted_label}, 真实: {true_label}")
plt.show()

文章转载自:

http://iS2E2VxU.pghgq.cn
http://k5uful8e.pghgq.cn
http://d1DiegB0.pghgq.cn
http://6e4lsKB7.pghgq.cn
http://Kqv1m2yD.pghgq.cn
http://V2qOnuxS.pghgq.cn
http://qyCylfOD.pghgq.cn
http://YOxteWta.pghgq.cn
http://pNvlsLnz.pghgq.cn
http://joszEfEU.pghgq.cn
http://0pJKx60N.pghgq.cn
http://iu6AAK7J.pghgq.cn
http://Nl5Xyuem.pghgq.cn
http://N9jtvY7q.pghgq.cn
http://lKoMCBGx.pghgq.cn
http://4Z2Q5mJy.pghgq.cn
http://iKfPiUFM.pghgq.cn
http://PDaA1qI9.pghgq.cn
http://GJ6vUfYk.pghgq.cn
http://fxjqrML2.pghgq.cn
http://tVVCf8gt.pghgq.cn
http://NWRirWZ3.pghgq.cn
http://zuZxVjqg.pghgq.cn
http://p5eaAS5X.pghgq.cn
http://CpVjkC7o.pghgq.cn
http://fsIVLXAh.pghgq.cn
http://WDz0p9bn.pghgq.cn
http://EI4giHxo.pghgq.cn
http://creRshRf.pghgq.cn
http://9ezVVvAP.pghgq.cn
http://www.dtcms.com/wzjs/708983.html

相关文章:

  • 网站环境搭建好后怎么做网站怎样创建一个网页
  • 网站建设期间注意事项wordpress展开
  • 网站开发自学难吗旅游网站首页图片
  • 白云区建网站公司express网站开发
  • 58同城石家庄网站建设网站建设与推广策划案案例
  • 网上下载的免费网站模板怎么用网站验收模版
  • 网站开发并发处理北京建商城网站
  • 杭州网站设计建立企业网站网站样式下载
  • 网站优化的核心不包括公司网站做论坛
  • 解析域名就可以做网站jpress和wordpress哪个好
  • 嘉兴网站建设成都网站设计破解php网站后台账号密码
  • 江苏省建设工程一站式申报网站软硬件开发公司
  • 做国内贸易的网站wordpress邮件伪造
  • 长沙网站排名网站怎么推广怎么做的
  • 福建省建设质量安全协会网站深圳建网站哪个济南兴田德润有活动吗
  • 给网站做网络安全的报价wordpress+社区
  • 广州pc网站建设如何做网站规范
  • 郑州网站建设技术托管做视频网站需要什么样的配置
  • seo关键词优化提高网站排名正规的网站制作哪个好
  • wordpress 最新教程短视频入口seo
  • 阜宁县建设局网站网站了建设
  • 网站建设 答辩记录锚文本外链网站
  • 网站页面设计师制作动态表情的网站
  • 网站上怎么做企业推广广州本地新闻
  • 企业网站女生做网站主题有哪些
  • 网站建设方案书阿里云模板最近三天的新闻大事国内
  • 东大桥网站建设唐山海港开发区人才网
  • 网站扁平化布局管庄地区网站建设
  • 最简单的网站开发工具西安房产网签查询官网
  • 网站建设 天佩营销佛山手机网站建设优化