当前位置: 首页 > news >正文

李宏毅NLP-1-课程介绍

NLP任务包含文本和语音

在这里插入图片描述
NLP的任务:

  • 听懂人说的话
  • 看懂人写的文句
  • 写出人懂得句子
  • 说出人听得懂的话

在这里插入图片描述
课程包含文本处理和语音处理。

在这里插入图片描述
很多语音没有存在文字,只有56%的语音才有文字,大约一半是没有文字的。

人类的语音和文本是复杂的

在这里插入图片描述
一秒包含16k的样本点,每个点又有256个可能取值。
在这里插入图片描述
同一个人说相同的字也会有不同的频谱。

在这里插入图片描述

一个句子最长的句子有13955个词汇。
在这里插入图片描述
在最长的句子前面或者后面加一点词汇又会破记录。

本课程学习的模型类型6种

在这里插入图片描述

  • 输入是语音,输出是文本
  • 输入是文本,输出是语音
  • 输入是语音,输出是语音
  • 输入是文本,输出是文本
  • 输入是语音,输出是类别
  • 输入是文本,输出是类别

自动语音识别ASR(automatic speech recognition)

在这里插入图片描述

在这里插入图片描述
传统的模型有很多个模块(2GB);
现在的模型也有是end-to-end(80MB);
在这里插入图片描述
end2end能够将模型大小下降到很多,能够在移动端运行。

文本语音合成TTS(text-to-speech synthesis)

在这里插入图片描述
在这里插入图片描述

Speech Separation

在这里插入图片描述
在这里插入图片描述
声音克隆
在这里插入图片描述

输入音频,输出类别

在这里插入图片描述

在这里插入图片描述
比如唤醒词唤醒
在这里插入图片描述

文本处理的任务

在这里插入图片描述

模型现在越来越大
在这里插入图片描述
在这里插入图片描述

文本生成 text-generation

在这里插入图片描述

其他应用

在这里插入图片描述

  • 翻译
  • 总结
  • 聊天机器人
  • 问答系统
    在这里插入图片描述
  • 句法分析树
    在这里插入图片描述
  • meta learning 学会学习

在这里插入图片描述
在这里插入图片描述

恶意攻击

在这里插入图片描述
在这里插入图片描述

  • 解释性AI
http://www.dtcms.com/a/74162.html

相关文章:

  • Excel导出工具类--复杂的excel功能导出(使用自定义注解导出)
  • C++实现线程安全的队列
  • 【Spring】第二弹:通过反射机制初步理解 IoC
  • C++从入门到入土(八)——多态的原理
  • 【GIS】重要技术3DGS
  • 改变一生的思维模型【12】笛卡尔思维模型
  • 【嵌入式学习】计算机组成原理-二进制存储基础
  • Spring Boot 的自动装配
  • 几种常见的激活函数解析
  • Vue学习笔记集--scoped组件
  • Elasticsearch面试题
  • 基于ssm的电子病历系统(全套)
  • 嵌入式项目代码架构与分层
  • 【AI 加持下的 Python 编程实战 2_04】第三章:GitHub Copilot 在 Python 函数设计中的正确打开方式(含本地实操)
  • python局部变量和全局变量
  • 深入理解 C++20 中的 `std::shared_ptr` 原子操作
  • JDK 动态代理和 CGLIB 动态代理
  • 新能源电站系统建设提速!麒麟信安操作系统驱动光伏风电双领域安全升级
  • PEFT简介
  • GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法
  • 特种兵旅游之大连3日游
  • Android视频渲染SurfaceView强制全屏与原始比例切换
  • 塔能科技:做节能界的“催化剂”,加速工厂能源改造变革
  • 「速通AI编程开发」共学(三):提示词(Prompts)配置项
  • [Spring]注解开发(2)
  • 【AutoFormer 源码理解】 conv1d
  • 【蓝桥杯】省赛:缴纳过路费(并查集)
  • 虚拟定位 1.2.0.2 | 虚拟定位,上班打卡,校园跑步模拟
  • AI幻觉时代:避坑指南与技术反思
  • 机器学习扫盲系列(2)- 深入浅出“反向传播”-1