当前位置：首页 > news >正文

神经网络与Transformer详解

news 2025/7/23 15:02:57

1. 一个模型的典型场景

对用户咨询的法律问题做自动归类：

婚姻纠纷、劳动纠纷、合同纠纷、债权债务、房产纠纷、交通事故、医疗纠纷、版权纠纷

在这里插入图片描述

2. 模型就是一个数学公式

我们一般将这样的问题描述为：给定一组输入数据，经过一系列数学公式计算后，输出n个概率，分别代表该用户对话属于某分类的概率

举个非常简单的例子：

在这里插入图片描述

3. 万金油公式 - 神经网络

确定数学公式的过程

1、公式：y = ax + b

2、参数：a = 50， b = -100

真实场景的任务，人类搞不定

神经网络的公式结构

MNIST（Mixed National Institute of Standards and Technology database）

包含了70,000张手写数字的图像，其中60,000张用于训练，10,000张用于测试，每张图像的内容只包含一个手写数字，从0到9的其中一个数字。

任务：给定一张28x28像素的灰度图像，经过一系列数学公式计算后，输出10个概率，分别代表该图像中的内容是0-9某个数字的概率

在这里插入图片描述

划重点：

这种在输入向量x和输出向量y之间，增加了一层z向量，并且用上述格式的计算公式去计算z向量和y向量中的每一个数值的结构，就叫做神经网络。

神经网络的参数设计

1、我可能会这样设计：设定z向量的长度为7

查看全文

http://www.dtcms.com/a/225441.html

多端学习方案起笔

Linux《文件系统》

uni-app学习笔记十九--pages.json全局样式globalStyle设置

git 学习

●day 2 任务以及具体安排：第一章数组part02

LM393红外避障电路Multisim仿真

Linux进程间通信----简易进程池实现

Leetcode 3567. Minimum Absolute Difference in Sliding Submatrix

设备驱动与文件系统：01 I/O与显示器

java swing 晃动鼠标改变背景颜色

Windows如何定制键盘按键

npm install命令都做了哪些事情

基于千帆大模型的AI体检报告解读系统实战：使用OSS与PDFBox实现PDF内容识别

UE5.4.4+Rider2024.3.7开发环境配置

设计模式——享元设计模式（结构型）

Tomcat 线程模型详解性能调优

如何安装ojdbc6-12.1.0.1与je-5.0.58的mvn构建依赖jar包？

解决Ubuntu20.04上Qt串口通信 QSerialPort 打开失败的问题

JMeter 直连数据库

Selenium的底层原理

724.寻找数组的中心下标前缀和

《Python基础》第2期：环境搭建

某航后缀混淆逆向与顶像风控分析

循环流化床锅炉关键技术设计与优化路径

【第四十七周】HippoRAG 2 复现与分析（一）：环境部署与代码分析

医疗数理范式化：从范式迁移到认知革命的深度解析

怎样在PyQt5中使用信号与槽机制？

开始使用 Elastic AI Assistant for Observability 和 Amazon Bedrock

六月一日python-AI代码

Python UV 环境下的 PyKDL 运动学库安装