当前位置: 首页 > news >正文

【大模型】理论基础(1):函数与神经网络

目录

前言

人工智能的本质是函数

如何找到这个函数?

函数和神经网络的关系


前言

从本篇开始,将进入一个大模型的专栏系列,本系列将涵盖以下方向的内容:

人工智能的理论基础、模型的预训练、模型的微调、模型的优化、模型的部署、实战场景等等。从小白的视角出发,从0开始系统性的养成一个大模型工程师。一起加油!

人工智能的本质是函数

“Functions describe the world”

函数是用来描述整个世界的语言,因为整个世界万物的协作都是相互动作之间的反馈,反馈就是应对不同输入给出的输出,所以我们可以用函数来描述世界万物。只是根据场景的不同,这个函数或简单或复杂。

所谓的人工智能其实就是函数,一个复杂函数,一个用来解决具体问题的复杂函数。比如用来视图的AI,输入是图片,输出是识别结果,图片和结果之间的函数关系就是这个视图AI;再比如对话AI,输入是问题,输出是回答,问题和回答之间的函数关系就是这个对话AI。

如何找到这个函数?

人工智能本质上就是用来解决某一个问题的函数,这个函数该如何找到?其实主要是靠猜,这也是整个人工智能的训练过程。

举个例子:

输入和输出的关系是一个一元函数的关系,假设这个一元函数y=wx+b,如何知道这个w和b的值是多少喃?很多人一看,这太简单了,把值带进去解一个二元一次函数嘛,超简单对吧。但是不能这样做,只能通过不停的去试w和b的值,从而找到w和b的值,如下图所示。

这时候大多数人就有个疑问:

【question】为什么不直接列方程求解?要快的多啊

【answer】因为绝大多数情况下,现实中的输入输出受很多“噪音”的影响,没办法找出一个绝对精准的函数来,只能找出一个近似值,比如下面这种:

函数和神经网络的关系

前面我们说了这个函数可能不是百分之百准确的这个问题,除了这个问题外,还有一个问题就是这条函数的线段绝大多数时候都不是直的。因为现实世界中输入和输出绝大多数时候不是简单的线性关系,这个时候就没办法用简单的线性函数来描述,怎么办?这个时候就要引入激活函数,当输入和输出不是线性关系的时候,需要在外层套一个非线性的函数作为激活函数,让这条线弯曲起来,比如在外层套一个sin,cos,平方等等。

f(x)=g(wx+b)

上面的g就是激活函数。

理论上可以在外面套无数层激活函数使得函数呈现出任意的非线性变换:

f(x)=g2(g1(wx+b)+w1)+w2

这种线性变换外面不停套激活函数,每一层激活函数就可以抽象成一个神经元,其输入是来自上一层的输出,这也就是神经网络,非输入输出的中间过程的层叫做隐藏层:

http://www.dtcms.com/a/544845.html

相关文章:

  • 认识主板总结与硬件工程师岗位笔试面试题集
  • Spring Boot Actuator 监控机制解析
  • 建设网站协议范本哈尔滨制作网页公司
  • 文章修改网站旅游管理论文题目选题
  • Rabbitmq扇形队列取消绑定交换机之后任然接收消息问题
  • 网站正在建设中代码哪个软件发视频可以赚钱
  • web网页开发,天气可视化开发,基于Python,FlaskWeb,无数据,数据写死
  • S11e Protocol:重塑品牌资产的 Web3 RWA 基础设施革命
  • 34_AI智能体工具插件之动态注册钉钉待办工具构建企业级任务管理AI助手
  • Java 大视界 -- Java 大数据在智慧文旅旅游线路规划与游客流量均衡调控中的应用实践
  • 33_AI智能体工具插件之钉钉API交互工具封装构建企业级AI应用
  • 数字孪生热力图可视化为何被广泛应用?
  • 国内免费可商用图片素材网站孝感做招聘信息的网站
  • Django在服务端的部署(无废话)
  • 当 AI Agent 遇上 MCP:微软 Agent Framework 的“瑞士军刀“式扩展之道
  • 个人网站建设培训药品网络营销公司
  • 20MW-10MWh储能项目施工方案
  • RHCA - DO374 | Day05:管理主机清单
  • 【完整源码+数据集+部署教程】【天线&水】无人机视角水面漂浮物体检测系统源码&数据集全套:改进yolo11-REPVGGOREPA
  • 思源实时同步设置步骤和节点部署
  • 电脑间如何快速传输大文件?4种高效数据迁移方法任选
  • 云栖实录 | AI原生搜索引擎:Elasticsearch 换“芯”——AI原生搜索内核增强技术
  • 手机可以做网站学校网站建设与管理办法
  • 网站建设流程的过程建设行政主管部门政务网站
  • 计算机网络-物理层
  • css面试题1
  • Git的原理与使用 -- 分支管理
  • 7.1.3 大数据方法论与实践指南-查询平台
  • 什么是所有权
  • 江苏建设网站公司合肥建设工程质量监督局网站