当前位置: 首页 > news >正文

李宏毅NLP-1-课程介绍

NLP任务包含文本和语音

在这里插入图片描述
NLP的任务:

  • 听懂人说的话
  • 看懂人写的文句
  • 写出人懂得句子
  • 说出人听得懂的话

在这里插入图片描述
课程包含文本处理和语音处理。

在这里插入图片描述
很多语音没有存在文字,只有56%的语音才有文字,大约一半是没有文字的。

人类的语音和文本是复杂的

在这里插入图片描述
一秒包含16k的样本点,每个点又有256个可能取值。
在这里插入图片描述
同一个人说相同的字也会有不同的频谱。

在这里插入图片描述

一个句子最长的句子有13955个词汇。
在这里插入图片描述
在最长的句子前面或者后面加一点词汇又会破记录。

本课程学习的模型类型6种

在这里插入图片描述

  • 输入是语音,输出是文本
  • 输入是文本,输出是语音
  • 输入是语音,输出是语音
  • 输入是文本,输出是文本
  • 输入是语音,输出是类别
  • 输入是文本,输出是类别

自动语音识别ASR(automatic speech recognition)

在这里插入图片描述

在这里插入图片描述
传统的模型有很多个模块(2GB);
现在的模型也有是end-to-end(80MB);
在这里插入图片描述
end2end能够将模型大小下降到很多,能够在移动端运行。

文本语音合成TTS(text-to-speech synthesis)

在这里插入图片描述
在这里插入图片描述

Speech Separation

在这里插入图片描述
在这里插入图片描述
声音克隆
在这里插入图片描述

输入音频,输出类别

在这里插入图片描述

在这里插入图片描述
比如唤醒词唤醒
在这里插入图片描述

文本处理的任务

在这里插入图片描述

模型现在越来越大
在这里插入图片描述
在这里插入图片描述

文本生成 text-generation

在这里插入图片描述

其他应用

在这里插入图片描述

  • 翻译
  • 总结
  • 聊天机器人
  • 问答系统
    在这里插入图片描述
  • 句法分析树
    在这里插入图片描述
  • meta learning 学会学习

在这里插入图片描述
在这里插入图片描述

恶意攻击

在这里插入图片描述
在这里插入图片描述

  • 解释性AI

相关文章:

  • Excel导出工具类--复杂的excel功能导出(使用自定义注解导出)
  • C++实现线程安全的队列
  • 【Spring】第二弹:通过反射机制初步理解 IoC
  • C++从入门到入土(八)——多态的原理
  • 【GIS】重要技术3DGS
  • 改变一生的思维模型【12】笛卡尔思维模型
  • 【嵌入式学习】计算机组成原理-二进制存储基础
  • Spring Boot 的自动装配
  • 几种常见的激活函数解析
  • Vue学习笔记集--scoped组件
  • Elasticsearch面试题
  • 基于ssm的电子病历系统(全套)
  • 嵌入式项目代码架构与分层
  • 【AI 加持下的 Python 编程实战 2_04】第三章:GitHub Copilot 在 Python 函数设计中的正确打开方式(含本地实操)
  • python局部变量和全局变量
  • 深入理解 C++20 中的 `std::shared_ptr` 原子操作
  • JDK 动态代理和 CGLIB 动态代理
  • 新能源电站系统建设提速!麒麟信安操作系统驱动光伏风电双领域安全升级
  • PEFT简介
  • GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法
  • 登封网站制作网站建设/央视新闻最新消息今天
  • 小程序模板多少钱一套/周口seo推广
  • 河南省建设厅执业资格注册中心网站/b2b平台是什么意思
  • 淄博网站建设服务/互动营销用在哪些推广上面
  • 网站和域名的区别/广告营销案例分析
  • 做网站送白酒/百度登录入口百度