当前位置: 首页 > wzjs >正文

大网站成本免费在线观看电影大全

大网站成本,免费在线观看电影大全,做装修设计的网站,求一个做美食视频的网站李宏毅老师《Pre-train Model》 什么是:Self-supervised Learning BERT BERT 能做什么 Mask Input Next Sentence Prediction(not helpful) BERT其它的能力 上述的能力,可以认为是一种填空的能力,那么除了这些,还有哪些有用的能力呢&…

李宏毅老师《Pre-train Model》

什么是:Self-supervised Learning
在这里插入图片描述

BERT

BERT 能做什么

Mask Input

在这里插入图片描述

Next Sentence Prediction(not helpful)

在这里插入图片描述

BERT其它的能力

上述的能力,可以认为是一种填空的能力,那么除了这些,还有哪些有用的能力呢?
在这里插入图片描述

BERT能力模型评估

GLUE(General Language Understanding Evaluation)

GLUE是一个自然语言理解(NLU)任务的评测基准,由华盛顿大学 & Google Brain 联合发布(2018 年)。

就像给 NLP 模型搞期末考试一样,通过一系列标准化任务,看模型对语言理解能力到底行不行。

GLUE 里都考什么?

GLUE 是一个任务集合(benchmark suite),包含了 9 个子任务,主要考:

  • 句子关系判断
  • 情感分类
  • 语义相似度
  • 推理能力
  • 语言蕴含关系

核心任务表:

任务名任务类型简介
MNLI句子蕴含 (NLI)判断两句话是否蕴含、矛盾或无关
QNLI问答 NLI判断一句话是否回答了问题
QQP句子相似度判断两个问题是否等价
SST-2情感分类判断句子是积极还是消极
CoLA语言学可接受性判断句子是否语法正确
MRPC句子对等判断判断两句话是否语义等价
STS-B语义相似度打分给两个句子相似度打分 (0~5)

BERT and its Family GLUE scores

在这里插入图片描述

TraIning BERT

在这里插入图片描述

How to use BERT

Use Case1: 情感分析

在这里插入图片描述

Use Case2: 词性标注

在这里插入图片描述

Use Case3: 自然语言蕴含推理

NLI(Natural Language Inference): 给定两句话,第二句是不是能从第一句推理出来、相矛盾,还是无关?

** NLI 任务通常分类**

标签含义举例
Entailment蕴含(能推导出来)A: “所有狗都会叫。” B: “我家狗会叫。”
Contradiction矛盾A: “所有狗都会叫。” B: “我家狗从不叫。”
Neutral无关或无法确定A: “所有狗都会叫。” B: “我家狗喜欢吃骨头。”

在这里插入图片描述

Use Case4: 抽取式问答

Extraction-based QA(抽取式问答) 是一种 从给定文本中直接抽取答案片段的问答方法。
特点:

  • 给定一段上下文 + 一个问题
  • 系统在上下文里找出一段或一句话,作为答案
  • 答案必须是原文里的内容(抽取出来,不是生成出来)

举个例子

上下文:“OpenAI 是一家人工智能研究机构,成立于 2015 年,总部位于旧金山。”
问题: “OpenAI 成立于哪一年?”
抽取式答案: “2015 年”

在这里插入图片描述

Why does BERT work?

Contextualized word embedding

在这里插入图片描述

Apply BERT to protein,DNA, music classification

在这里插入图片描述

Multi-lingual BERT

:用英文的QA问题训练,用中文做QA问答
在这里插入图片描述

why

这些相同语意的词,中、英文词 的词向量很近.
在这里插入图片描述

零样本阅读理解

Zero-shot Reading Comprehension(零样本阅读理解 )指的是: 不给模型提供任何相似示例,直接让模型基于上下文和问题,理解语义、判断答案或生成回答。

例:

  • 上下文:“OpenAI 成立于 2015 年,总部在旧金山,专注于 AI 技术研究。”

  • 问题: “OpenAI 的总部在哪?”

  • Zero-shot 模型行为:
    • 没有事先见过类似「总部在哪」的训练样本
    • 依靠语言理解能力,定位上下文中的「总部在旧金山」,直接输出

它和 Few-shot / Fine-tuning 的区别
类型定义示例
Zero-shot完全不给示例,直接回答只给上下文和问题
Few-shot给几条类似示例,再回答给 2~5 个 QA 示例
Fine-tuning预先用大量类似数据微调,提升特定任务能力用大量阅读理解任务微调好的模型


GPT(Generative Pre-trained Transformer)

生成式预训练 Transformer 模型

Predict Next Token

<BOS>: begin-of-sentence

在这里插入图片描述

How to use GPT

在这里插入图片描述

Few-shot/One-shot/Zero-shot Learning

在这里插入图片描述


T5

T5全称: Text-To-Text Transfer Transformer
由 Google AI 团队 2019 年发布,发表在论文《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》

它和 GPT 最大不同

  • GPT 是文本 → 文本生成偏生成式
  • T5 是·“所有 NLP 任务都统一成 Text-to-Text 格式”

不管是翻译、分类、问答、摘要,全部都按照这个套路来做:

输入:一句文本(带任务提示)
输出:一句文本(任务结果)

本质上就是一个编码器-解码器结构的 Transformer。

T5 典型应用场景

应用场景举例
机器翻译translate English to French: How are you? → Comment ça va ?
问答系统question: Who founded OpenAI? context: OpenAI was founded in 2015 by Elon Musk and Sam Altman. → Elon Musk and Sam Altman
文本摘要summarize: OpenAI is an AI company founded in 2015... → An AI company founded in 2015.
文本分类classify sentiment: I love this product. → positive
语义相似度sts: Sentence A. Sentence B. → 4.5(打分形式)

#T5、BERT、GPT 各自区别

模型架构类型输入-输出形式典型用途能否生成文本
BERT编码器-only,双向编码文本 → 分类/判断分类、问答、NER、相似度匹配
GPT解码器-only,自回归生成文本 → 续写文本对话、文章续写、代码生成
T5编码器-解码器(双向+自回归)文本 → 文本(统一文本形式)翻译、摘要、问答、分类等多任务

文章转载自:

http://ujYI6doc.gbwfx.cn
http://DsA92wvT.gbwfx.cn
http://fpR6ZtKB.gbwfx.cn
http://ePjVKwjU.gbwfx.cn
http://cb8xgpHV.gbwfx.cn
http://jhfOCw6z.gbwfx.cn
http://mYrOqGoT.gbwfx.cn
http://ud6blTpf.gbwfx.cn
http://hljM9Pfu.gbwfx.cn
http://QEpHl2Ye.gbwfx.cn
http://L8rupyPq.gbwfx.cn
http://lunalCwc.gbwfx.cn
http://BjKNC4gU.gbwfx.cn
http://JA28dTP5.gbwfx.cn
http://KSK6p063.gbwfx.cn
http://WLwicwnS.gbwfx.cn
http://YHuZx6xS.gbwfx.cn
http://l4cD81x3.gbwfx.cn
http://89IRxXvh.gbwfx.cn
http://qM8Yvy9J.gbwfx.cn
http://s2qIT11a.gbwfx.cn
http://Jom5KW6y.gbwfx.cn
http://bMLpSA4M.gbwfx.cn
http://NWBoRVWI.gbwfx.cn
http://T7ptX4NF.gbwfx.cn
http://bvWNPH8S.gbwfx.cn
http://tmqhM2GM.gbwfx.cn
http://eXDMx4kc.gbwfx.cn
http://adG9LIsy.gbwfx.cn
http://ae96wNeL.gbwfx.cn
http://www.dtcms.com/wzjs/663270.html

相关文章:

  • php源码下载网站沈阳关键字优化公司
  • 买2g 空间做下载网站wordpress媒体文件
  • 网站怎么做更新吗天水有做网站的地方吗
  • 如何开淘宝店并运营店铺seo优化网站优化排名
  • 餐馆效果图网站游戏开发大亨内购破解版
  • 品牌网站建设黑白H狼昆明优秀网站
  • 深圳做品牌网站wordpress注册邮箱验证
  • 建站优化信息推广多个wordpress站点同步
  • cms搭建网站汝阳县住房与城乡建设局建局网站
  • 深圳网站制作公司售后韶关网站建设公司
  • 毕业设计做啥网站好搜索推广代运营
  • 服装企业网站策划书优化网站的公司哪家好
  • seo推广营销网站制作网站软件都在什么公司
  • 郑州陆港开发建设有限公司网站专业网站建设市场分析
  • 扬中网站建设公司黄骅市官网
  • 维护一个网站的安全seo外链优化
  • 珠江新城网站建设群晖wordpress外网访问
  • 做医疗器械网站wordpress柒零贰
  • 易语言网站批量注册怎么做网站建设可视化
  • 郑州优化网站关键词wordpress 导航函数
  • 网站开发网站开个淘宝店做网站设计好吗
  • 网络建站如何建成深圳福田做网站公司哪家好
  • 吉安网站制作公司排名一家公司做两个网站吗
  • 服务号网站建设在哪个网站上可以学做衣服
  • 网站解决方案电商网站模板
  • 山西住房与城乡建设厅定额网站网站模板免费推荐
  • 手机网站设计案例c2c电子商务网站
  • 微信网站建设费记什么科目管理软件属于什么软件
  • 做网站设计学那个专业好微网站自己怎么做的
  • 网站开发工期安排普陀建设网站