当前位置: 首页 > news >正文

深入理解 NumPy:Python 科学计算的基石

在数据科学、人工智能和科学计算的世界里,NumPy 是一块绕不过去的基石。它是 Python 语言中用于高性能科学计算的基础包,几乎所有的数据分析与机器学习框架(如 Pandas、TensorFlow、Scikit-learn)都离不开它的支持。

一、什么是 NumPy?

NumPy(Numerical Python)是一个开源的 Python 库,主要用于支持大型多维数组与矩阵运算,同时提供了大量的数学函数库用于对这些数组进行操作。其核心数据结构是 ndarray,一个多维数组对象。

NumPy 的优势:

  • 更高效的数据存储与计算性能

  • 支持广播(broadcasting)机制

  • 丰富的线性代数、傅里叶变换与随机数生成工具

  • 与 C、C++ 和 Fortran 的接口优秀,支持底层扩展


二、NumPy 安装

安装 NumPy 最简单的方法是使用 pip 或 conda:

pip install numpy
# 或者使用 Anaconda
conda install numpy

安装完成后可以这样导入:

import numpy as np

三、NumPy 核心数据结构:ndarray

1. 创建 ndarray

import numpy as npa = np.array([1, 2, 3])               # 一维数组
b = np.array([[1, 2], [3, 4]])        # 二维数组
c = np.zeros((2, 3))                  # 全 0 数组
d = np.ones((2, 3))                   # 全 1 数组
e = np.eye(3)                         # 单位矩阵
f = np.arange(0, 10, 2)               # 生成等差序列
g = np.linspace(0, 1, 5)              # 生成等距分布的数

2. 数组属性

print(a.shape)      # 数组维度
print(a.ndim)       # 维数
print(a.dtype)      # 元素类型
print(a.size)       # 元素个数

四、数组操作

1. 数组索引与切片

arr = np.array([[1, 2, 3], [4, 5, 6]])print(arr[0, 2])       # 获取第一行第三列的元素
print(arr[:, 1])       # 获取所有行的第二列
print(arr[1, :2])      # 获取第二行的前两列

2. 数组形状变换

a = np.arange(6)           # [0, 1, 2, 3, 4, 5]
a = a.reshape((2, 3))      # 转换为 2 行 3 列
a.T                        # 转置
a.flatten()                # 展平成一维

3. 数组合并与拆分

a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6]])# 合并
np.vstack((a, b))          # 竖直堆叠
np.hstack((a, a))          # 水平堆叠# 拆分
np.split(a, 2, axis=0)     # 沿第 0 轴拆分

五、广播机制(Broadcasting)

NumPy 可以让不同形状的数组在一起执行运算,前提是它们遵循广播规则:

a = np.array([1, 2, 3])
b = 2
print(a + b)      # 输出:[3, 4, 5]A = np.ones((2, 3))
B = np.array([1, 2, 3])
print(A + B)      # 每一行加上 [1, 2, 3]

六、常用函数

1. 数学函数

a = np.array([1, 2, 3])np.sqrt(a)
np.exp(a)
np.log(a)
np.sin(a)

2. 聚合函数

a = np.array([[1, 2], [3, 4]])np.sum(a)
np.mean(a)
np.std(a)
np.max(a, axis=0)
np.min(a, axis=1)

七、线性代数操作

NumPy 拥有强大的线性代数模块:

from numpy.linalg import inv, det, eig, solveA = np.array([[1, 2], [3, 4]])inv(A)         # 求逆
det(A)         # 行列式
eig(A)         # 特征值与特征向量
b = np.array([5, 6])
solve(A, b)    # 解线性方程 Ax = b

八、随机数生成

np.random.seed(0)            # 设置随机种子
np.random.rand(2, 3)         # 均匀分布
np.random.randn(2, 3)        # 正态分布
np.random.randint(0, 10, 5)  # 整数
np.random.choice([1, 2, 3], size=4)

九、实际应用示例:矩阵回归模型

# 简单的线性回归计算示例: y = Xβ
X = np.array([[1, 1], [1, 2], [1, 3]])
y = np.array([1, 2, 3])# 最小二乘解: β = (X.T X)^-1 X.T y
beta = np.linalg.inv(X.T @ X) @ X.T @ y
print("线性回归系数:", beta)

输出:

线性回归系数: [0. 1.]

这说明模型 y = x 完全拟合了数据。


十、总结

NumPy 是 Python 科学计算的基础设施。熟练掌握 NumPy,能帮助你写出更高效、更简洁的数值计算代码,也为深入学习 Pandas、Scikit-learn、TensorFlow 等框架打下坚实的基础。

建议的学习路径:

  • 掌握 ndarray 的基本操作

  • 学会广播和向量化操作

  • 理解数组运算的内存和性能特点

  • 尝试用 NumPy 完成简单的数值计算任务

相关文章:

  • 【Bootstrap V4系列】学习入门教程之 组件-导航(Navs)高级用法
  • Nacos源码—9.Nacos升级gRPC分析八
  • 物理:从人出生和死亡的角度来讨论基本粒子的创生和湮灭以及是否守恒?
  • Spark 缓存(Caching)
  • 配置Nginx启用Https
  • C++中void*知识详解和注意事项
  • LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
  • Pytorch张量和损失函数
  • Java详解LeetCode 热题 100(15):LeetCode 189. 轮转数组(Rotate Array)详解
  • 工程类论文查重困局破解:基于知识图谱的跨学科语义重构技术实证研究
  • 通讯录程序
  • 利用比较预言机处理模糊的偏好数据
  • Java Spring MVC -01
  • [Java实战]Spring Boot 3 整合 Apache Shiro(二十一)
  • 多模态融合【十九】——MRFS: Mutually Reinforcing Image Fusion and Segmentation
  • GOOSE 协议中MAC配置
  • CVE-2025-31258 macOS远程视图服务沙箱逃逸漏洞PoC已公开
  • JAVA研发+前后端分离,ZKmall开源商城B2C商城如何保障系统性能?
  • 使用scp命令拷贝hadoop100中文件到其他虚拟机中
  • 深度学习之优化器【从梯度下降到自适应学习率算法】(pytorch版)
  • 北斗专访|特赞科技范凌:现在AI主要是“说话”,接下来要“干活”了
  • 沈阳卫健委通报“健康证”办理乱象:涉事医院已被立案查处
  • 小米SU7 Ultra风波升级:数百名车主要求退车,车主喊话雷军“保持真诚”
  • 人民网评:守护健康证的“健康”,才有舌尖上的安全
  • 中美大幅下调超100%关税,印巴四日“战争”复盘|907编辑部
  • 商务部新闻发言人就中美日内瓦经贸会谈联合声明发表谈话