当前位置: 首页 > news >正文

3-机器学习与大模型开发数学教程-第0章 预备知识-0-3 函数初步(多项式、指数、对数、三角函数、反函数)

在数学和机器学习中,函数是最重要的概念之一。直观上,函数就像是一台“机器”,输入一个数,经过一系列规则加工,输出另一个数。比如你把苹果放进榨汁机,出来的是苹果汁——这就是“输入”和“输出”的关系。

在机器学习里,模型本质上就是一个复杂的函数:输入数据(图像、文本、音频),输出预测结果(分类、生成、翻译)。所以打好函数的基础,对理解 AI 模型至关重要。


1. 多项式函数

最常见的函数就是 多项式函数,形式为:

f(x)=anxn+an−1xn−1+⋯+a1x+a0f(x) = a_n x^n + a_{n-1} x^{n-1} + \dots + a_1 x + a_0f(x)=anxn+an1xn1++a1x+a0

比如:

  • 一次函数:f(x)=2x+3f(x)=2x+3f(x)=2x+3(直线)
  • 二次函数:f(x)=x2−4x+3f(x)=x^2-4x+3f(x)=x24x+3(抛物线)

直观类比:多项式函数就像是“配方”,把原料 xxx 按照不同的比例(系数)和加工方式(幂次方)混合起来。

在机器学习中:线性回归模型就是最简单的一次多项式;更复杂的模型(比如神经网络)可以看作是多项式函数的组合。


2. 指数函数

指数函数的基本形式是:

f(x)=ax(a>0,a≠1)f(x) = a^x \quad (a>0, a \neq 1)f(x)=ax(a>0,a=1)

  • a>1a > 1a>1 时,函数呈 指数增长(比如病毒传播、互联网用户数增长)。
  • 当 $0 时,函数呈 指数衰减(比如药物浓度随时间下降)。

在机器学习中

  • 学习率衰减常用指数函数。
  • 概率分布(如 softmax 函数)中也有指数运算。

3. 对数函数

对数函数是指数函数的反函数:

f(x)=log⁡a(x)(a>0,a≠1)f(x) = \log_a(x) \quad (a>0, a \neq 1)f(x)=loga(x)(a>0,a=1)

含义:回答“某个数是底数 aaa 的几次幂?”
例如:log⁡2(8)=3\log_2(8)=3log2(8)=3,因为 23=82^3=823=8

直观类比
指数函数是“复利滚雪球”,对数函数是“问雪球有多大时,它是滚了几次”。

在机器学习中

  • 信息论中的 信息熵、交叉熵损失函数用到对数。
  • 对数常用来缩放数据,解决数值过大问题。

4. 三角函数

三角函数与角度和周期现象相关,比如:

sin⁡(x),cos⁡(x),tan⁡(x)\sin(x), \quad \cos(x), \quad \tan(x)sin(x),cos(x),tan(x)

它们的特点是 周期性,经常用来描述波动。

直观类比:海浪的起伏、四季的变化、电台的信号,都是周期性的,可以用三角函数建模。

在机器学习中

  • Transformer 的位置编码(Positional Encoding)就使用了正弦和余弦函数,帮助模型理解序列的顺序。

5. 反函数

一个函数如果可以“逆转过程”,就有 反函数

比如:

  • 指数函数 y=2xy=2^xy=2x 的反函数是对数函数 y=log⁡2(x)y=\log_2(x)y=log2(x)
  • 平方函数 y=x2y=x^2y=x2 的反函数(在非负数范围内)是平方根函数 y=xy=\sqrt{x}y=x

我们可以用一个 Mermaid 图来展示函数与反函数的关系:

函数 f
反函数 f_inverse
x 输入
y 输出

说明

  • 函数 fff 把输入 xxx 变成输出 yyy
  • 反函数 f−1f^{-1}f1yyy 再还原成 xxx
  • 两者是互逆的,就像“加法”和“减法”,“加密”和“解密”。

从几何角度来看,函数与反函数的图像是 关于直线 y=xy=xy=x 对称的


总结

  • 多项式:机器学习的基本模型(线性回归就是一次多项式)。
  • 指数与对数:描述增长与衰减,在概率和损失函数中常见。
  • 三角函数:处理周期性问题,比如 Transformer 的位置编码。
  • 反函数:理解“可逆映射”,帮助我们把“结果”还原成“输入”。

函数世界是整个数学和机器学习的基础。后续的微积分、线性代数、概率论,几乎都离不开函数的概念。


文章转载自:

http://Yo0snBLy.ffLnj.cn
http://0llPAHX3.ffLnj.cn
http://s9jY4v2k.ffLnj.cn
http://JCxuahGR.ffLnj.cn
http://2lUHdVvF.ffLnj.cn
http://hXqbMxxK.ffLnj.cn
http://54j3BVuy.ffLnj.cn
http://iPGBp2ZF.ffLnj.cn
http://06zqWfBM.ffLnj.cn
http://kvYNHITD.ffLnj.cn
http://GhipgA9D.ffLnj.cn
http://lrkcZYWs.ffLnj.cn
http://RsXN029k.ffLnj.cn
http://IrRZ8HDs.ffLnj.cn
http://zUf8hGis.ffLnj.cn
http://amtr1pGJ.ffLnj.cn
http://r5XZAXBC.ffLnj.cn
http://14ULW6MK.ffLnj.cn
http://OBWcwjHD.ffLnj.cn
http://VBJ55kSu.ffLnj.cn
http://qQtan1OR.ffLnj.cn
http://nogBY6gn.ffLnj.cn
http://t8mqYRBd.ffLnj.cn
http://9EAYm6Lu.ffLnj.cn
http://QG6YRgrW.ffLnj.cn
http://O5kUcl0w.ffLnj.cn
http://8yX4q8hd.ffLnj.cn
http://dlxLEi1p.ffLnj.cn
http://qFi9fsZP.ffLnj.cn
http://6Gy8LLEa.ffLnj.cn
http://www.dtcms.com/a/382153.html

相关文章:

  • 使用Aop和自定义注解实现SpringTask定时任务中加锁逻辑的封装
  • 远程依赖管理新范式:cpolar赋能Nexus全球协作
  • 【个人项目】【前端实用工具】OpenAPI to TypeScript 转换器
  • 贪心算法应用:物流装箱问题详解
  • 《用 TensorFlow 构建回归模型:从零开始的预测之路》
  • charles功能
  • Ceph OSD 元数据信息
  • Stanford CS336 | Assignment 2 - FlashAttention-v2 Pytorch Triotn实现
  • 【Docker】容器
  • C++ 类型推导(第一部分)
  • 联邦学习模型完成之后在验证集上面,如何判断输出正确与否
  • 优选算法---链表
  • 从理据到算法:认知语义学象似性对人工智能深层语义分析的重塑与前瞻
  • 39.网络流入门
  • PTQ 模型 量化方法
  • 基于Spring Boot的家政服务管理系统+论文示例参考
  • uniapp封装长按一直触发事件和松开后触发一次的事件(自定义事件)
  • Unity核心概念⑦:Transform
  • 【数据行业发展】可信数据空间~数据价值的新型基础设施
  • 使用“洋葱架构”构建单体应用
  • DAY 27 函数专题2:装饰器-2025.9.14
  • 浅析Linux进程信号处理机制:基本原理及应用
  • php学习(第五天)
  • C盘清理技巧分享的技术文章大纲
  • PINN物理信息神经网络驱动的三维声波波动方程求解MATLAB代码
  • 深度学习优化器进化史:从SGD到AdamW的原理与选择
  • 计算机视觉(opencv)实战十九——角点检测图像特征(Harris 角点、Shi-Tomasi 角点)
  • 【限流器设计】固定窗口计数法
  • Estimator and Confidence interval
  • 构建AI智能体:三十二、LangChain智能体:打造会使用工具(Tools)、有记忆(Memory)的AI助手