当前位置：首页 > news >正文

李宏毅NLP-1-课程介绍

news 2025/10/16 22:44:44

NLP任务包含文本和语音

在这里插入图片描述
NLP的任务：

听懂人说的话
看懂人写的文句
写出人懂得句子
说出人听得懂的话

在这里插入图片描述
课程包含文本处理和语音处理。

在这里插入图片描述
很多语音没有存在文字，只有56%的语音才有文字，大约一半是没有文字的。

人类的语音和文本是复杂的

在这里插入图片描述
一秒包含16k的样本点，每个点又有256个可能取值。

同一个人说相同的字也会有不同的频谱。

在这里插入图片描述

一个句子最长的句子有13955个词汇。
在这里插入图片描述
在最长的句子前面或者后面加一点词汇又会破记录。

本课程学习的模型类型6种

在这里插入图片描述

输入是语音，输出是文本
输入是文本，输出是语音
输入是语音，输出是语音
输入是文本，输出是文本
输入是语音，输出是类别
输入是文本，输出是类别

自动语音识别ASR（automatic speech recognition）

在这里插入图片描述

在这里插入图片描述
传统的模型有很多个模块（2GB）；
现在的模型也有是end-to-end（80MB）；

end2end能够将模型大小下降到很多，能够在移动端运行。

文本语音合成TTS（text-to-speech synthesis）

在这里插入图片描述

Speech Separation

在这里插入图片描述

声音克隆

输入音频，输出类别

在这里插入图片描述

在这里插入图片描述
比如唤醒词唤醒

文本处理的任务

在这里插入图片描述

模型现在越来越大
在这里插入图片描述

文本生成 text-generation

在这里插入图片描述

其他应用

在这里插入图片描述

翻译
总结
聊天机器人
问答系统
句法分析树
meta learning 学会学习

在这里插入图片描述

恶意攻击

在这里插入图片描述

解释性AI

http://www.dtcms.com/a/74162.html

相关文章：

Excel导出工具类--复杂的excel功能导出(使用自定义注解导出)

C++实现线程安全的队列

【Spring】第二弹：通过反射机制初步理解 IoC

C++从入门到入土（八）——多态的原理

【GIS】重要技术3DGS

改变一生的思维模型【12】笛卡尔思维模型

【嵌入式学习】计算机组成原理-二进制存储基础

Spring Boot 的自动装配

几种常见的激活函数解析

Vue学习笔记集--scoped组件

Elasticsearch面试题

基于ssm的电子病历系统(全套)

嵌入式项目代码架构与分层

【AI 加持下的 Python 编程实战 2_04】第三章：GitHub Copilot 在 Python 函数设计中的正确打开方式（含本地实操）

python局部变量和全局变量

深入理解 C++20 中的 `std::shared_ptr` 原子操作

JDK 动态代理和 CGLIB 动态代理

新能源电站系统建设提速！麒麟信安操作系统驱动光伏风电双领域安全升级

PEFT简介

GitHub Copilot 在 VS Code 上的终极中文指南：从安装到高阶玩法

特种兵旅游之大连3日游

Android视频渲染SurfaceView强制全屏与原始比例切换

塔能科技：做节能界的“催化剂”，加速工厂能源改造变革

「速通AI编程开发」共学（三）：提示词（Prompts）配置项

[Spring]注解开发(2)

【AutoFormer 源码理解】 conv1d

【蓝桥杯】省赛：缴纳过路费（并查集）

虚拟定位 1.2.0.2 | 虚拟定位，上班打卡，校园跑步模拟

AI幻觉时代：避坑指南与技术反思

机器学习扫盲系列（2）- 深入浅出“反向传播”-1