当前位置：首页 > news >正文

31.Encoder-Decoder（Seq2Seq）

news 2025/8/27 11:26:26

常见网络结构

在这里插入图片描述

One2One
固定大小的输入，固定大小的输出。如：图像分类任务，输入固定大小图片，输出一个类别。
One2Many
固定大小的输入，不固定大小的输出。如：看图说话、用词造句。

在这里插入图片描述

Many2One
不固定的输入，固定的输出。如：语句情感分析、文章分类、视频分类
Many2Many同步
固定长度的序列，输出等长的序列。如：词性标注、字符级预测、视频帧级分类
Many2Many异步——Seq2Seq
不固定输入，不固定输出。如：机器翻译、命题作文、语音识别。

Encoder-Decoder

编码器-解码器架构：不固定输入，不固定输出。分为编码和解码两个部分：编码器处理输入序列，经过一个隐藏层输出向量。解码器把向量作为输入，输出新序列。
在这里插入图片描述

训练时

Decoder并不是把当前时刻的输出，作为下一时刻的输入。训练阶段的Decoder，输入时刻为目标序列（橙色）。
意为：如果在输出am的位置，输出的不是am，而是is。那么，下一时刻的输入（橙色am位置），依然为am。
其实好理解，这是训练阶段，他做错了，你需要纠正他。这个过程叫做Teacher Forcing。
在这里插入图片描述

预测时

decoder的当前输入，作为下一时刻输出。

在这里插入图片描述

http://www.dtcms.com/a/352299.html

相关文章：

MySQL8 排名窗口函数实战

面试:Spring

30.LSTM-长短时记忆单元

抢红包案例加强版

并行多核体系结构基础——共享存储并行编程（笔记）

网络编程close学习

Java大厂面试实录：从Spring Boot到Kubernetes的全链路技术突围

python命名规则（PEP 8 速查表），以及自定义属性

深度感知卷积和深度感知平均池化

python自动测试 crictl 可以从哪些国内镜像源成功拉取镜像

pulsar、rocketmq常用命令

C#由Dictionary不正确释放造成的内存泄漏问题与GC代系

Text to Speech技术详解与实战：GPT-4o Mini TTS API应用指南

从“脚本语言”到“企业级引擎”——PHP 在 2025 年技术栈中的再定位

Linux服务器安全配置与NTP时间同步

记录一下，qt问题：qt ui文件的改动无法更新到cpp

疯狂星期四文案网第51天运营日记

Typescript入门-interface讲解

类型签名，位置参数，关键字参数

open webui源码分析8—管道

域名常见问题集（十一）——为什么要进行域名管理？

【实时Linux实战系列】基于实时Linux的音频实时监控系统

从16个粉丝到680万年收入：AI创业的117天奇迹

声明式微服务通信新范式：OpenFeign如何简化RestTemplate调用

Windows下实现类似`watch nvidia-smi`的实时监控效果

进入docker中mysql容器的方法

Java：TreeSet的使用

(Arxiv-2024)VideoMaker：零样本定制化视频生成，依托于视频扩散模型的内在力量

QT qml（quick3D）模型的移动

专业解读《Light》封面：可调谐混合超表面（THCMs）如何革新下一代LiDAR系统