当前位置：首页 > news >正文

李宏毅机器学习笔记25

news 2025/10/18 8:41:27

目录

摘要

1.Self-supervised Learning

2.BERT

MASKING

Next sentence predition

3.Fine-tune

摘要

本篇文章继续学习李宏毅老师2025春季机器学习课程，学习内容是Self-supervised Learning的基础概念以及BERT训练方式和BERT用在下游任务的例子

1.Self-supervised Learning

首先supervised是什么？就是一个model，输入一个x输出一个y，要让输出的y是我们所期待的，就要有label的资料，用label的资料去训练。

那什么是self-supervised呢？假设我们现在有一堆文章但是没有标注，我们把资料分为两部分，一部分作为模型的输入，一部分作为模型的标注。然后输出的y让他跟作为标注的资料对比，越接近越好。这就是self-supervised learning。

2.BERT

BERT其实就是transformer的encoder，通常用在自然语言处理上，所以它的输入一般为文字。

MASKING

假设输入一段文字，我们随机盖住一些文字，即将文字换为特殊符号（mask），或者随机替换为其他文字。之后用盖住部分对应的BERT输出的向量，做一个linear transform（乘一个矩阵），再做softmax，得到包含所有中文字（常见，自己设定的长向量）一个分布。

那么BERT需要训练的是，这个盖住部分对应的BERT输出的向量，要与原本被盖住前的字越接近越好。训练时BERT和Linear一起训练，这个训练方法叫做masking。

Next sentence predition

另一个方法叫做Next sentence predition，意思是从资料库拿出两个句子，再两个句子间加入特殊的分隔符号(SEP)，再两个句子的最前面加入一个特别的符号（CLS）,把两个句子和符号一起丢入BERT，我们只取CLS对应的输出，做linear transform，它要做的是一个二元分类的问题，输出yes或no，他要预测的就是这两个句子是否是相接的。

3.Fine-tune

虽然BERT训练时，表现只是会做填空题或者判断两个句子是否可以拼接，但是它可以完成的任务不只是这样而已，还有downstream tasks，但是需要一些有标注的资料。

例子1，在sentiment analysis问题上，输入判断的句子，输出一个类别。

例子2，输入一个句子，输出一个句子但是他们长度相同，例如词性标注问题。

例子3，输入两个句子，输出一个类别，解决分类的问题。例如natural language inference(NLI),就是一个句子是前提，另一个句子是假设，机器要判断这个前提能不能推出这个假设，他们是否矛盾。

例子4，假设答案一定在文章中的问答系统，输入D,Q假设是中文字，那么每个d和q都代表一个中文字，输入是整篇文章D和问题Q，输出是两个正整数s，e。根据s，e从文章中截取出来的文字就是答案。

模型要做的事情就是训练两个向量，下图表示为一个橙色，一个蓝色，与文章中的每个文字进行inner product，选出最后得出的分数最高的，一个为起始位置，一个为末尾位置。

http://www.dtcms.com/a/495495.html

相关文章：

大连模板建站哪家好网站如何加入百度联盟

当大模型遇上 HTTP：一次“无状态”的相似性思考

衡阳网站设计ss0734如何做公司官网

asp网站做文件共享上传手机个别网页打不开

做网站图网页搭建环境

山西网站制作wifi扩展器做网站

利用VOSviewer快速可视化文献全过程（以Web of science为例）

appcms程序怎么做网站网站管理公司

[Qt] 什么是qmake与cmake

DevOps学习笔记

DevOps是什么，有什么作用，一般用来干嘛

Go语言：关于导包的两个重要说明

21 种网络攻击方式，如何有效防护!

工厂电商网站建设WordPress网易云插卡

STM32H743-ARM例程23-USB_HID

丽水微信网站建设哪家好阿里巴巴国际站坑人

网站通知发送邮件广州深圳外贸网站建设公司

LOL实时数据推送技术揭秘：WebSocket在电竞中的应用

STC89C52RC---坤坤铁山靠

幽冥大陆(十五)SIM300 拨打电话和短信——东方仙盟筑基期

SpringBoot校园二手商城系统

贸易网站建设一个网站建设需要多少钱

网站查询空间商企业不开了网站备案吗

iframe内嵌子系统可返回

【读书笔记】《巨人的工具》

【实战详解】MySQL 8.0递归查询终极教程：附组织架构/分类树完整代码

最新网站开发工具东莞推广外包

双目测距实战3-立体匹配

战斗系统架构：为什么游戏战斗适合ECS架构?

【C语言加油站】C语言文件操作完全指南：feof、ferror与缓冲区机制详解