当前位置: 首页 > news >正文

神经网络与Transformer详解

1. 一个模型的典型场景

对用户咨询的法律问题做自动归类:

婚姻纠纷、劳动纠纷、合同纠纷、债权债务、房产纠纷、交通事故、医疗纠纷、版权纠纷

在这里插入图片描述

2. 模型就是一个数学公式

我们一般将这样的问题描述为:给定一组输入数据,经过一系列数学公式计算后,输出n个概率,分别代表该用户对话属于某分类的概率
举个非常简单的例子:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3. 万金油公式 - 神经网络

确定数学公式的过程

1、公式:y = ax + b
2、参数:a = 50, b = -100
真实场景的任务,人类搞不定

神经网络的公式结构

MNIST(Mixed National Institute of Standards and Technology database)

包含了70,000张手写数字的图像,其中60,000张用于训练,10,000张用于测试,每张图像的内容只包含一个手写数字,从0到9的其中一个数字。
任务:给定一张28x28像素的灰度图像,经过一系列数学公式计算后,输出10个概率,分别代表该图像中的内容是0-9某个数字的概率

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
划重点:

  1. 这种在输入向量x和输出向量y之间,增加了一层z向量, 并且用上述格式的计算公式去计算z向量和y向量中的每一个数值的结构, 就叫做神经网络。

神经网络的参数设计

1、我可能会这样设计:设定z向量的长度为7

相关文章:

  • 多端学习方案起笔
  • Linux《文件系统》
  • uni-app学习笔记十九--pages.json全局样式globalStyle设置
  • git 学习
  • ●day 2 任务以及具体安排:第一章 数组part02
  • LM393红外避障电路Multisim仿真
  • Linux进程间通信----简易进程池实现
  • Leetcode 3567. Minimum Absolute Difference in Sliding Submatrix
  • 设备驱动与文件系统:01 I/O与显示器
  • java swing 晃动鼠标改变背景颜色
  • Windows如何定制键盘按键
  • npm install命令都做了哪些事情
  • 基于千帆大模型的AI体检报告解读系统实战:使用OSS与PDFBox实现PDF内容识别
  • UE5.4.4+Rider2024.3.7开发环境配置
  • 设计模式——享元设计模式(结构型)
  • Tomcat 线程模型详解性能调优
  • 如何安装ojdbc6-12.1.0.1与je-5.0.58的mvn构建依赖jar包?
  • 解决Ubuntu20.04上Qt串口通信 QSerialPort 打开失败的问题
  • JMeter 直连数据库
  • Selenium的底层原理
  • 为自己网站建设/关键词分为哪三类
  • 北京做网站设计招聘/网络营销有哪些特点
  • 如何使用网站模板建设网站/网站推广策划思路的内容
  • 崇左市住房和城乡建设局网站/最新新闻消息
  • 网站建设师/网站seo关键词设置
  • 网站系统怎么做的/域名权重查询