当前位置: 首页 > news >正文

Python 数据分析与机器学习入门 (五):Matplotlib 数据可视化基础

引言:为何可视化至关重要?

俗话说,“一图胜千言”。在数据分析领域,这句话尤其正确。原始的数据表格和统计摘要虽然精确,但往往难以揭示数据中隐藏的模式、趋势、异常值和关系。数据可视化通过将数据转换成图形,利用人类视觉系统的强大能力来快速识别这些信息,是**探索性数据分析(EDA)**中不可或缺的一环。

Matplotlib 是 Python 中最基础、最强大的数据可视化库。它为创建各种静态、动态和交互式图表提供了坚实的基础。几乎所有其他高级可视化库(如 Seaborn)都是在 Matplotlib 的基础上构建的。因此,掌握 Matplotlib 是进行任何严肃数据可视化的前提。

Matplotlib 的解剖学:Figure 与 Axes

要真正掌握 Matplotlib,首先需要理解其核心的两个对象:FigureAxes

  • Figure: 可以看作是整个图表的“画布”或“画框”。它是一个顶层容器,可以包含一个或多个图表(Axes)、标题、图例等所有绘图元素。
  • Axes: 这是实际的“绘图区域”或“子图”。我们平时所说的“一个图”,在 Matplotlib 的语境下通常指的就是一个 Axes 对象。它包含了数据点、x 轴(xaxis)、y 轴(yaxis)、刻度、标签等。一个 Figure 对象可以包含一个或多个 Axes 对象。

把它们想象成一幅画:Figure 是整个画框,而每个 Axes 是画框里的一幅独立的画。

两种绘图方式:Pyplot vs. 面向对象 (OO)

Matplotlib 提供了两种主要的绘图接口:

  1. Pyplot 接口 (状态机接口): 这是一系列函数的集合(如 plt.plot(), plt.title()),它会自动管理当前的 FigureAxes。这种方式对于快速、简单的绘图非常方便,其风格类似于 MATLAB。
  2. 面向对象 (OO) 接口: 这是更强大、更灵活的方式。我们首先显式地创建一个 Figure 对象和一个或多个 Axes 对象(通常使用 fig, ax = plt.subplots()),然后调用这些对象的方法来绘图和进行定制(如 ax.plot(), ax.set_title())。

为什么我们强烈推荐面向对象 (OO) 的方式?

对于初学者来说,pyplot 接口似乎更简单。然而,一旦你需要绘制更复杂的图表,比如在一个 Figure 中放置多个子图,或者对某个特定的子图进行精细控制时,pyplot 的状态机机制就会变得混乱和难以管理。你很难确定当前的 plt 函数到底作用于哪个子图。

面向对象的方式则从根本上解决了这个问题。通过 fig, ax = plt.subplots(),你得到了对 FigureAxes 对象的直接引用。当你调用 ax.set_title() 时,你非常清楚地知道这个标题是属于 ax 这个特定的子图的。这种明确的控制使得代码更具可读性、可维护性,并且是创建复杂、可复用图表的标准做法。从一开始就学习和使用 OO 风格,会为你未来的学习之路打下更坚实的基础。

你的第一张图 (使用 OO 风格)

让我们遵循标准的 OO 风格工作流,创建几种最常见的图表。

标准工作流:

  • 导入库: import matplotlib.pyplot as pltimport numpy as np
  • 准备数据
  • 创建 Figure 和 Axes: fig, ax = plt.subplots()
  • 在 Axes 上绘图: ax.plot(), ax.scatter() 等。
  • 定制图表: ax.set_title(), ax.set_xlabel(), ax.set_ylabel(), ax.legend()
  • 显示图表: plt.show()

折线图 (Line Plot)

折线图非常适合展示数据随时间或某个连续变量变化的趋势。

import matplotlib.pyplot as plt
import numpy as npx = np.linspace(0, 10, 100)
y = np.sin(x)# 1. 创建 Figure 和 Axes
fig, ax = plt.subplots()# 2. 在 Axes 上绘图
ax.plot(x, y)# 3. 定制图表
ax.set_title('Simple Sine Wave')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis (sin(x))')# 4. 显示图表
plt.show()

柱状图 (Bar Chart)

柱状图用于比较不同类别之间的数量。

import matplotlib.pyplot as pltcategories = ['A', 'B', 'C', 'D']
values = [23, 45, 55, 19]fig, ax = plt.subplots()
ax.bar(categories, values, color='skyblue')ax.set_title('Category Comparison')
ax.set_xlabel('Category')
ax.set_ylabel('Value')plt.show()

散点图 (Scatter Plot)

散点图用于可视化两个数值变量之间的关系,帮助我们发现相关性。

import matplotlib.pyplot as plt
import numpy as np# 生成随机数据
x = np.random.rand(50)
y = np.random.rand(50)
colors = np.random.rand(50)
sizes = 1000 * np.random.rand(50)fig, ax = plt.subplots()
# 使用 c 参数映射颜色,s 参数映射大小,cmap 指定颜色图谱
ax.scatter(x, y, c=colors, s=sizes, alpha=0.5, cmap='viridis')ax.set_title('Scatter Plot Example')
ax.set_xlabel('X Value')
ax.set_ylabel('Y Value')plt.show()

直方图 (Histogram)

直方图用于展示单个数值变量的分布情况。

import matplotlib.pyplot as plt
import numpy as np# 生成符合正态分布的随机数据
data = np.random.randn(1000)fig, ax = plt.subplots()
ax.hist(data, bins=30, edgecolor='black')ax.set_title('Distribution of Data')
ax.set_xlabel('Value')
ax.set_ylabel('Frequency')plt.show()

总结与展望

在本篇中,我们学习了 Matplotlib 的基本概念,特别是 FigureAxes 的区别,并强烈推荐了面向对象的绘图风格。我们还实践了如何使用 OO 风格创建四种最基本的图表:折线图、柱状图、散点图和直方图。

虽然 Matplotlib 功能强大且灵活,但有时绘制美观的统计图表需要编写较多的样板代码。为了解决这个问题,社区开发了 Seaborn。在下一篇文章中,我们将学习 Seaborn 如何在 Matplotlib 的基础上,用更简洁的代码创建出更具美感和信息量的统计图形。

http://www.dtcms.com/a/263271.html

相关文章:

  • R1-Searcher使用强化学习增强语言模型解决问题的搜索能力
  • WebSocket 的核心原理和工作流程
  • 前端Vue面试八股常考题(一)
  • 企业流程知识:《超越再造:以流程为中心的组织如何改变我们的工作和生活》读书笔记
  • 力扣面试150(7/150)
  • 【c/c++2】多线程,动静态库,信号,socket
  • 如何让宿主机完全看不到Wi-Fi?虚拟机独立联网隐匿上网实战!
  • 【知识图谱构建系列7】:结果评价(1)
  • 可编辑39页PPT | 数字化工厂蓝图整体框架建设举措建设路径实施路线规划建设方案
  • 从入门到精通:npm、npx、nvm 包管理工具详解及常用命令
  • Microsoft Edge 打开无反应、打开后显示兼容性问题、卸载重装 解决方案。一键卸载Microsoft Edge 。
  • 卫朋:华为流程体系拆解系列——IPD流程L1-L6分级导入实战演练
  • android BottomSheet及AlertDialog的几种material3 常见ui的用法
  • vue上传各种文件,并预览组件,(预览,下载),下载resources目录下文件
  • vmware 17 安装win11 24h2
  • 【解析】 微服务测试工具Parasoft SOAtest如何为响应式架构助力?
  • MongoDB 常见查询语法与命令详解
  • 设计模式精讲 Day 19:观察者模式(Observer Pattern)
  • 自由学习记录(64)
  • 傅里叶变换理解
  • Instruct-GPT奖励模型的损失函数与反向传播机制解析
  • opencv入门(1)环境变量配置
  • FOC中V/F启动和I/F启动的区别
  • 零成本接入+企业级部署:2025年AI大模型实战指南
  • 企业自建云概念解读|私有云、专有云、混合云、分布式云、企业云
  • 【零基础学AI】第14讲:支持向量机实战 - 文本分类系统
  • 华为云 Flexus+DeepSeek 征文|基于 Dify 平台开发智能客服 AI Agent 的完整实战指南
  • python+uniapp基于微信小程序蜀味道江湖餐饮管理系统nodejs+java
  • 矩阵方程 线性代数
  • 微服务架构下的JWT深度实践:从原理到安全最佳实践