当前位置: 首页 > news >正文

机器学习16:自监督式学习(Self-Supervised Learning)②

摘要

        本周重点学习了自监督式学习中的两大代表性模型——BERT 与 GPT。BERT 通过“填空”和句子连贯性判断任务,学习上下文感知的词嵌入表示,能够有效处理一词多义问题,并在跨语言任务中表现出色。其嵌入向量能捕捉词汇语义和上下文信息,甚至可迁移至非文本任务(如 DNA 分类)。GPT 则采用自回归方式预测下一个 token,具备文本生成能力,并支持少样本、单样本和零样本学习,展现出强大的泛化能力。两者均为自监督学习的典型应用,推动了自然语言处理的发展。

Abstract

        This week's focus was on self-supervised learning, particularly on two representative models: BERT and GPT. BERT learns context-aware word embeddings through "fill-in-the-blank" and sentence coherence tasks, effectively handling polysemy and performing well in cross-lingual tasks. Its embeddings capture semantic and contextual information and can even be transferred to non-text tasks such as DNA classification. GPT, on the other hand, uses an autoregressive approach to predict the next token, enabling text generation and supporting few-shot, one-shot, and zero-shot learning, demonstrating strong generalization capabilities. Both models are key applications of self-supervised learning and have significantly advanced the field of natural language processing.

一.BERT的用处

        前面我们通过BERT来学习自监督式学习,了解了BERT主要是为了完成两件事“填空”以及判断两个句子前后是否连贯。那对于这两个简单的事件也就是说BERT完成的事情非常的简单但其为什么被应用广泛呢?

        1.常见的理由

        最常见的解释就是如下,对于BERT输入一串文字,每一个文字对应到BERT输出的一个向量,相反的这些向量也代表了对应输入的字,对于这些向量我们接下来称之为嵌入(embedding)。

        对于向量能够代表对应输入的字,具体来说就是将一些字对应的向量表示出来,就会发现两个字的意思越相近,其对应的向量就越接近。

http://www.dtcms.com/a/445604.html

相关文章:

  • MySQL+keepalived主主复制
  • 深入理解操作系统中的线程
  • 栈:每日温度
  • 从普通用户到AI专家:掌握“专家指南模板”,获取可复现、深度且精确的AI专业反馈
  • Photoshop调色
  • Google Jules Tools —— 开发者的新助手
  • 做方案的网站同城58找房子租房信息
  • 【LeetCode hot100|Week5】链表2
  • 刘家窑网站建设公司附近哪有学编程的地方
  • MP偏振相机在工业视觉检测中的应用
  • 安全初级(二)HTTP
  • 数组算法精讲:从入门到实战
  • 对文件的输入和输出
  • CSS3 过渡
  • 手机网站代码asp做网站策划书
  • macOS sequoia 15.7.1 源码安装node14,并加入nvm管理教程
  • LabVIEW利用DataSocket读取OPC 服务器数据
  • 第十章:外观模式 - 复杂系统的简化大师
  • 【数据结构】顺序栈的基本操作
  • 哈尔滨网站开发企业网站一直维护意味着什么
  • 第4集:配置管理的艺术:环境变量、多环境配置与安全实践
  • soular入门到实战(2) - 如何统一管理TikLab帐号体系
  • C语言进阶知识--指针(3)
  • M-LLM Based Video Frame Selection for Efficient Video Understanding论文阅读
  • 福州建设高端网站wordpress中控制图片标签
  • Prometheus 05-01: 告警规则与Alertmanager配置
  • 【Linux】Mysql的基本文件组成和配置
  • 简单易用!NAS+Leantime,开源轻量级项目管理,高效协作一键开启
  • 大数据毕业设计选题推荐-基于大数据的全球用水量数据可视化分析系统-大数据-Spark-Hadoop-Bigdata
  • NLP:迁移学习关于领域自适应的基础讲解