当前位置: 首页 > news >正文

31.Encoder-Decoder(Seq2Seq)

常见网络结构

在这里插入图片描述

  • One2One
    固定大小的输入,固定大小的输出。如:图像分类任务,输入固定大小图片,输出一个类别。
    在这里插入图片描述

  • One2Many
    固定大小的输入,不固定大小的输出。如:看图说话、用词造句。

在这里插入图片描述

  • Many2One
    不固定的输入,固定的输出。如:语句情感分析、文章分类、视频分类
    在这里插入图片描述
    在这里插入图片描述

  • Many2Many同步
    固定长度的序列,输出等长的序列。如:词性标注、字符级预测、视频帧级分类
    在这里插入图片描述

  • Many2Many异步——Seq2Seq
    不固定输入,不固定输出。如:机器翻译、命题作文、语音识别。
    在这里插入图片描述

Encoder-Decoder

编码器-解码器架构:不固定输入,不固定输出。分为编码和解码两个部分:编码器处理输入序列,经过一个隐藏层输出向量。解码器把向量作为输入,输出新序列。
在这里插入图片描述

训练时

Decoder并不是把当前时刻的输出,作为下一时刻的输入。训练阶段的Decoder,输入时刻为目标序列(橙色)。
意为:如果在输出am的位置,输出的不是am,而是is。那么,下一时刻的输入(橙色am位置),依然为am。
其实好理解,这是训练阶段,他做错了,你需要纠正他。这个过程叫做Teacher Forcing。
在这里插入图片描述

预测时

decoder的当前输入,作为下一时刻输出。

在这里插入图片描述

http://www.dtcms.com/a/352299.html

相关文章:

  • MySQL8 排名窗口函数实战
  • 面试:Spring
  • 30.LSTM-长短时记忆单元
  • 抢红包案例加强版
  • 并行多核体系结构基础——共享存储并行编程(笔记)
  • 网络编程close学习
  • Java大厂面试实录:从Spring Boot到Kubernetes的全链路技术突围
  • python命名规则(PEP 8 速查表),以及自定义属性
  • 深度感知卷积和深度感知平均池化
  • python自动测试 crictl 可以从哪些国内镜像源成功拉取镜像
  • pulsar、rocketmq常用命令
  • C#由Dictionary不正确释放造成的内存泄漏问题与GC代系
  • Text to Speech技术详解与实战:GPT-4o Mini TTS API应用指南
  • 从“脚本语言”到“企业级引擎”——PHP 在 2025 年技术栈中的再定位
  • Linux服务器安全配置与NTP时间同步
  • 记录一下,qt问题:qt ui文件的改动无法更新到cpp
  • 疯狂星期四文案网第51天运营日记
  • Typescript入门-interface讲解
  • 类型签名,位置参数,关键字参数
  • open webui源码分析8—管道
  • 域名常见问题集(十一)——为什么要进行域名管理?
  • 【实时Linux实战系列】基于实时Linux的音频实时监控系统
  • 从16个粉丝到680万年收入:AI创业的117天奇迹
  • 声明式微服务通信新范式:OpenFeign如何简化RestTemplate调用
  • Windows下实现类似`watch nvidia-smi`的实时监控效果
  • 进入docker中mysql容器的方法
  • Java:TreeSet的使用
  • (Arxiv-2024)VideoMaker:零样本定制化视频生成,依托于视频扩散模型的内在力量
  • QT qml(quick3D)模型的移动
  • 专业解读《Light》封面:可调谐混合超表面(THCMs)如何革新下一代LiDAR系统