当前位置: 首页 > news >正文

PyTorch Transformers| Azure

 

数据迁移

 

 PyTorch和 Transformers 是不同层面的工具,核心区别如下:

- PyTorch:是一个深度学习框架,类似“建造房子的工具箱”,提供张量计算、神经网络搭建、模型训练等基础功能,是实现AI模型的底层工具


- Transformers:是一个预训练模型库(由Hugging Face开发),类似“已经造好的房屋模块”,基于PyTorch/TensorFlow等框架,封装了BERT、GPT等主流预训练模型,能直接用于文本生成、翻译等任务,无需从零造模型。

  • 用PyTorch可以“从零造模型”
  • 而用Transformers能“直接用现成的高级模型”
  • 且后者依赖前者(或其他框架)才能运行。

 用一个具体场景(比如文本分类)演示两者的实际用法差异吗?这样能更直观理解它们的配合关系

以“文本分类”(比如判断一句话是正面还是负面评价)为例,通过代码核心逻辑对比两者用法,不涉及复杂细节:

 

1. 用PyTorch实现(从零搭模型)

需手动定义网络结构、处理数据,步骤繁琐:

import torch

import torch.nn as nn

 

# 1. 手动定义简单神经网络(自己造“房屋框架”)

class SimpleNet(nn.Module):

    def __init__(self):

        super().__init__()

        self.fc1 = nn.Linear(512, 256) # 全连接层1

        self.fc2 = nn.Linear(256, 2) # 输出层(2类:正/负)

 

    def forward(self, x):

        x = torch.relu(self.fc1(x))

        return self.fc2(x)

 

# 2. 手动加载、处理数据(自己准备“建材”)

# (此处省略几百行:文本转向量、划分训练/测试集、构建数据加载器...)

 

# 3. 初始化模型、训练(自己动手“盖房子”)

model = SimpleNet()

optimizer = torch.optim.Adam(model.parameters())

# (再省略几百行:循环训练、计算损失、反向传播...)

 

 

2. 用Transformers实现(直接用现成模型)

无需定义网络,调用封装好的预训练模型,几行搞定核心逻辑:

from transformers import BertTokenizer, BertForSequenceClassification

 

# 1. 加载现成的预训练模型和分词器(直接拿“现成房屋模块”)

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') # 文本转模型能懂的格式

model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=2) # 自带分类头

 

# 2. 处理数据(工具帮你做,无需手动写)

text = "这个产品超好用!"

inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)

 

# 3. 直接推理(不用训练也能跑,或少量微调)

with torch.no_grad():

    outputs = model(**inputs)

    predictions = torch.argmax(outputs.logits, dim=1) # 直接得到分类结果(正/负)

 

核心差异很明显:

  • PyTorch需要“从0到1造轮子”
  • Transformers则是“直接用调好的轮子跑”

 

http://www.dtcms.com/a/466443.html

相关文章:

  • 2.c++面向对象(二)
  • 苍穹外卖-Apache ECharts与数据统计
  • 合肥企业建站系统wap网站浏览器
  • python进阶_Day4
  • 网站开发小图标大全wordpress显示当前位置
  • 江苏建设信息网站有时候打不开网站建设客户问题
  • .Net Core WebApi集成Swagger
  • 趣味学网工:IPv6是连接未来的数字基石(IPv6的技术地位、重要作用、市场行情、应用场景等)
  • Linux 基本入门
  • 用ClaudeCode完善我的项目
  • 开源系统网站爱游戏app下载官方网站
  • SPA路由回退机制解析:解决History模式下的404问题
  • 边界感知分治:基于扩散模型的无监督阴影去除方案
  • 传输介质的简介
  • TPS, MIS, DSS, ES考题
  • 网站建设服务非常好湖南岚鸿公司响应式网站模版
  • 我的网站被攻击了!
  • 新乡专业的网站建设公司网站模板 php
  • WPS编辑排版之我见
  • 云空间网站怎么做工程中心网站建设汇报
  • 在线Linux 练习平台 (二)
  • wordpress怎样搭建外贸网站工厂的网站在哪里做的
  • 代码案例实践
  • 网站推广费用入什么科目wordpress相册博客类主题
  • 常见虚拟化技术
  • 网站怎么能被百度收录那个视频网站做公开课比较好
  • 站长工具成品源码手机看电影的网站建设
  • webpack,vite,node等启动服务时运行一段时间命令窗口就卡住
  • 设计模式篇之 原型模式 Prototype
  • 广西南宁网站排名优化亿级流量网站架构