当前位置：首页 > news >正文

机器学习16：自监督式学习（Self-Supervised Learning）②

news 2025/10/6 6:06:39

摘要

本周重点学习了自监督式学习中的两大代表性模型——BERT 与 GPT。BERT 通过“填空”和句子连贯性判断任务，学习上下文感知的词嵌入表示，能够有效处理一词多义问题，并在跨语言任务中表现出色。其嵌入向量能捕捉词汇语义和上下文信息，甚至可迁移至非文本任务（如 DNA 分类）。GPT 则采用自回归方式预测下一个 token，具备文本生成能力，并支持少样本、单样本和零样本学习，展现出强大的泛化能力。两者均为自监督学习的典型应用，推动了自然语言处理的发展。

Abstract

This week's focus was on self-supervised learning, particularly on two representative models: BERT and GPT. BERT learns context-aware word embeddings through "fill-in-the-blank" and sentence coherence tasks, effectively handling polysemy and performing well in cross-lingual tasks. Its embeddings capture semantic and contextual information and can even be transferred to non-text tasks such as DNA classification. GPT, on the other hand, uses an autoregressive approach to predict the next token, enabling text generation and supporting few-shot, one-shot, and zero-shot learning, demonstrating strong generalization capabilities. Both models are key applications of self-supervised learning and have significantly advanced the field of natural language processing.

一．BERT的用处

前面我们通过BERT来学习自监督式学习，了解了BERT主要是为了完成两件事“填空”以及判断两个句子前后是否连贯。那对于这两个简单的事件也就是说BERT完成的事情非常的简单但其为什么被应用广泛呢？

1.常见的理由

最常见的解释就是如下，对于BERT输入一串文字，每一个文字对应到BERT输出的一个向量，相反的这些向量也代表了对应输入的字，对于这些向量我们接下来称之为嵌入（embedding）。

对于向量能够代表对应输入的字，具体来说就是将一些字对应的向量表示出来，就会发现两个字的意思越相近，其对应的向量就越接近。

http://www.dtcms.com/a/445604.html

相关文章：

MySQL+keepalived主主复制

深入理解操作系统中的线程

栈：每日温度

从普通用户到AI专家：掌握“专家指南模板”，获取可复现、深度且精确的AI专业反馈

Photoshop调色

Google Jules Tools —— 开发者的新助手

做方案的网站同城58找房子租房信息

【LeetCode hot100|Week5】链表2

刘家窑网站建设公司附近哪有学编程的地方

MP偏振相机在工业视觉检测中的应用

安全初级（二）HTTP

数组算法精讲：从入门到实战

对文件的输入和输出

CSS3 过渡

手机网站代码asp做网站策划书

macOS sequoia 15.7.1 源码安装node14，并加入nvm管理教程

LabVIEW利用DataSocket读取OPC 服务器数据

第十章：外观模式 - 复杂系统的简化大师

【数据结构】顺序栈的基本操作

哈尔滨网站开发企业网站一直维护意味着什么

第4集：配置管理的艺术：环境变量、多环境配置与安全实践

soular入门到实战(2) - 如何统一管理TikLab帐号体系

C语言进阶知识--指针（3）

M-LLM Based Video Frame Selection for Efficient Video Understanding论文阅读

福州建设高端网站wordpress中控制图片标签

Prometheus 05-01: 告警规则与Alertmanager配置

【Linux】Mysql的基本文件组成和配置

简单易用！NAS+Leantime，开源轻量级项目管理，高效协作一键开启

大数据毕业设计选题推荐-基于大数据的全球用水量数据可视化分析系统-大数据-Spark-Hadoop-Bigdata

NLP：迁移学习关于领域自适应的基础讲解