当前位置: 首页 > news >正文

4-机器学习与大模型开发数学教程-第0章 预备知识-0-4 复数与指数形式(欧拉公式)

在学习机器学习和大模型之前,除了集合、逻辑、数列,我们还要认识一个“神秘的朋友”——复数(Complex number)
复数不仅仅是数学里的“虚数”,它还在信号处理、神经网络中的傅里叶变换、Transformer 里的注意力机制等地方频繁出现。


0-3 复数与指数形式

1. 什么是复数?

我们先从实数说起:

  • 实数轴:包含整数、有理数、小数……
  • 但是有些方程在实数范围解不出来,比如:
    x2+1=0x^2 + 1 = 0x2+1=0
    在实数里没有解。

这时数学家“发明”了一个新单位:

i=−1i = \sqrt{-1}i=1

于是我们得到 复数

z=a+bi,(a,b∈R)z = a + bi, \quad (a, b \in \mathbb{R})z=a+bi,(a,bR)

这里:

  • aaa 是实部(real part);
  • bbb 是虚部(imag part)。

生活类比

  • 可以把复数想象成二维坐标:(a,b)(a, b)(a,b)
  • 实部是“东西方向”,虚部是“南北方向”。

在平面直角坐标系上,复数就是一个点。


2. 复数的几何表示

复数 z=a+biz = a + biz=a+bi 可以在平面上画成一个点 (a,b)(a, b)(a,b)
如果把原点作为起点,这个点也可以看作一根向量。

我们可以用极坐标来描述它:

  • 长度(模):
    r=∣z∣=a2+b2r = |z| = \sqrt{a^2 + b^2}r=z=a2+b2
  • 角度(辐角):
    θ=arctan⁡(ba)\theta = \arctan\left(\frac{b}{a}\right)θ=arctan(ab)

于是:
z=r(cos⁡θ+isin⁡θ)z = r(\cos \theta + i \sin \theta)z=r(cosθ+isinθ)

这个表示方式就是 复数的指数形式 的基础。


3. 欧拉公式

欧拉公式是数学里最美的桥梁之一:

eiθ=cos⁡θ+isin⁡θe^{i\theta} = \cos \theta + i \sin \thetaeiθ=cosθ+isinθ

它把指数函数、三角函数、虚数联系到了一起。

为什么成立?
回忆幂级数展开:

  • 指数函数:
    ex=1+x1!+x22!+x33!+…e^x = 1 + \frac{x}{1!} + \frac{x^2}{2!} + \frac{x^3}{3!} + \dotsex=1+1!x+2!x2+3!x3+

  • 代入 x=iθx = i\thetax=iθ

eiθ=1+iθ1!+(iθ)22!+(iθ)33!+…eiθ=1+iθ1!+(iθ)22!+(iθ)33!+… eiθ=1+iθ1!+(iθ)22!+(iθ)33!+…e^{i\theta} = 1 + \frac{i\theta}{1!} + \frac{(i\theta)^2}{2!} + \frac{(i\theta)^3}{3!} + \dots eiθ=1+iθ1!+(iθ)22!+(iθ)33!+eiθ=1+1!iθ+2!(iθ)2+3!(iθ)3+

  • 拆开:

    • 实部 = cos⁡θ\cos \thetacosθ
    • 虚部 = isin⁡θi\sin \thetaisinθ

于是得到:
eiθ=cos⁡θ+isin⁡θe^{i\theta} = \cos \theta + i \sin \thetaeiθ=cosθ+isinθ


graph TDA[实数指数 e^x]B[虚数指数 e^(iθ)]C[cosθ + i·sinθ]A --> B --> C

图示说明:欧拉公式展示了指数函数如何自然地延伸到复数域,把“旋转角度”与“指数增长”联系起来。


4. 复数的指数形式

利用欧拉公式,我们可以写:

z=reiθz = r e^{i\theta}z=reiθ

这就是复数的指数形式。

它非常方便:

  • 乘法:模相乘,角度相加
    z1z2=r1r2ei(θ1+θ2)z_1 z_2 = r_1 r_2 e^{i(\theta_1+\theta_2)}z1z2=r1r2ei(θ1+θ2)
  • 幂运算:
    zn=rneinθz^n = r^n e^{i n \theta}zn=rneinθ
    (这就是著名的 棣莫弗公式

直观理解
复数相乘 ≈ 向量旋转并缩放。


5. 在机器学习中的应用

复数和欧拉公式并不是“纯理论”的,它们在 AI 里有不少影子:

  1. 傅里叶变换
    • 信号处理、语音识别、图像压缩,核心都是把信号分解成“正弦和余弦”的组合。
    • 这正是欧拉公式的威力:eiθe^{i\theta}eiθ 本质上就是旋转波。
  2. 神经网络中的卷积
    • 卷积定理表明:卷积在时域对应频域的乘法。
    • 而频域就是通过复数和欧拉公式得到的傅里叶空间。
  3. Transformer 与注意力机制
    • 近年来有研究把注意力机制用傅里叶变换加速。
    • 背后同样离不开复数的指数形式。

小结

  • 复数:扩展了实数,形如 a+bia+bia+bi
  • 几何表示:复数可以看作平面上的点或向量。
  • 欧拉公式eiθ=cos⁡θ+isin⁡θe^{i\theta} = \cos \theta + i\sin \thetaeiθ=cosθ+isinθ,连接了指数和三角函数。
  • 指数形式z=reiθz = re^{i\theta}z=reiθ,让乘法与旋转结合,非常简洁。
  • AI 应用:复数与傅里叶变换、卷积、注意力机制紧密相关,是大模型背后的数学基石之一。

文章转载自:

http://KcI2PTVq.mrckk.cn
http://lBYueV9z.mrckk.cn
http://U8IFhhsw.mrckk.cn
http://kXmTjGoy.mrckk.cn
http://9LpoB0kE.mrckk.cn
http://1CYZknCN.mrckk.cn
http://48ljUA4t.mrckk.cn
http://Nt2T8doV.mrckk.cn
http://JgvKxeO1.mrckk.cn
http://ngCfGIbb.mrckk.cn
http://tpxnLfSs.mrckk.cn
http://Y6EsSTOB.mrckk.cn
http://JJS7RZMI.mrckk.cn
http://gWeuHwKa.mrckk.cn
http://zPLsTvx8.mrckk.cn
http://uIAs0axX.mrckk.cn
http://p1Pr62Yv.mrckk.cn
http://smGfu6SZ.mrckk.cn
http://bBSa4VB1.mrckk.cn
http://uPvOO8st.mrckk.cn
http://YluQ3rWW.mrckk.cn
http://s8qAg3Kd.mrckk.cn
http://t25z0y2C.mrckk.cn
http://1ZZKQftf.mrckk.cn
http://e7w4DI94.mrckk.cn
http://nRNpdjhN.mrckk.cn
http://H5fPbBgs.mrckk.cn
http://C4qiElO5.mrckk.cn
http://cgAToAnl.mrckk.cn
http://KHg51ngf.mrckk.cn
http://www.dtcms.com/a/382591.html

相关文章:

  • TA-VLA——将关节力矩反馈融入VLA中:无需外部力传感器,即可完成汽车充电器插入(且可多次自主尝试)
  • 从0到1开发一个商用 Agent(智能体),Agent零基础入门到精通!_零基础开发aiagent 用dify从0到1做智能体
  • android 消息队列MessageQueue源码阅读
  • Gtest2025大会学习记录(全球软件测试技术峰会)
  • oneshape acad数据集 sam-dataset
  • 堆(优先队列)
  • 【卷积神经网络详解与实例】7——经典CNN之AlexNet
  • Digital Clock 4,一款免费的个性化桌面数字时钟
  • mysql 必须在逗号分隔字符串和JSON字段之间二选一,怎么选
  • 分布式锁介绍与实现
  • 海盗王客户端dx9的64位release版测试
  • MX模拟赛总结
  • FLEXSPI_Init 硬件故障问题
  • Linux进程概念(下):进程地址空间
  • C++11_3(智能指针篇)
  • 从理论到实践:构建高效AI智能体系统的架构演进
  • 如何运用好DeepSeek为自己服务:智能增强的范式革命 | 1.3 人机认知耦合协议
  • 什么是PV操作?
  • 详解数据仓库和数据集市:ODS、DW、DWD、DWM、DWS、ADS
  • C++ `std::unique_lock` 深度解析:掌控并发资源的智能管家
  • 人员主数据的系统集成
  • C++(静态函数)
  • SonarQube代码质量管理平台本地化搭建和使用
  • Redis 线上问题排查完整手册
  • 异常数据处理全攻略:原理、方法与Python实战
  • Python 进阶:从基础到实战的核心技能提升
  • Scikit-learn:从零开始构建你的第一个机器学习模型
  • 如何快速获取全机硬件详细参数?
  • 嵌入式ARM架构学习7——时钟、定时器
  • 【C++练习】17.C++求两个整数的最大公约数(GCD)