【第一章:人工智能基础】02.数据处理及可视化-(3)可视化工具与技术
第一章 人工智能基础
第二部分:数据处理及可视化
第四节:可视化工具与技术
内容:Matplotlib 和 Seaborn 的基础使用及图表类型(如折线图、柱状图、散点图等)
一、为什么要可视化数据?
数据可视化是人工智能项目中不可或缺的一环。它能帮助我们:
-
快速理解数据的分布与趋势
-
识别数据中的异常与模式
-
对模型结果进行直观展示
Python 中常用的可视化工具有 Matplotlib 和 Seaborn,后者是在前者基础上的高级封装,使用更简洁,样式更美观。
二、Matplotlib 基础使用
【人工智能】Python常用库-Matplotlib常用方法教程-CSDN博客
1. 导入和基本设置
import matplotlib.pyplot as plt
%matplotlib inline # Jupyter 中可视化显示
2. 折线图(Line Chart)
x = [1, 2, 3, 4]
y = [2, 4, 1, 3]
plt.plot(x, y)
plt.title("折线图示例")
plt.xlabel("X轴")
plt.ylabel("Y轴")
plt.show()
3. 柱状图(Bar Chart)
labels = ['A', 'B', 'C']
values = [10, 15, 7]
plt.bar(labels, values)
plt.title("柱状图示例")
plt.show()
4. 散点图(Scatter Plot)
x = [1, 2, 3, 4]
y = [10, 8, 6, 4]
plt.scatter(x, y)
plt.title("散点图示例")
plt.show()
三、Seaborn 基础使用
【人工智能】Python常用库-Seaborn常用方法教程_pip install seaborn-CSDN博客
Seaborn 是基于 Matplotlib 的高级可视化库,风格更加现代美观,适合快速进行统计图表绘制。
import seaborn as sns
import pandas as pd
1. 示例数据集
df = sns.load_dataset("tips") # 自带数据集
df.head()
2. 关系图(散点图)
sns.scatterplot(x="total_bill", y="tip", data=df)
plt.title("消费金额 vs 小费")
plt.show()
3. 柱状图
sns.barplot(x="day", y="total_bill", data=df)
plt.title("不同日期的消费总额")
plt.show()
4. 折线图
虽然 Seaborn 不专门用于折线图,但可配合 pandas:
df_grouped = df.groupby("day")["total_bill"].mean().reset_index()
sns.lineplot(x="day", y="total_bill", data=df_grouped)
plt.title("每日平均消费")
plt.show()
四、其他常见图表(Seaborn)
-
箱型图(boxplot):查看分布与异常值
-
直方图(histplot):查看频率分布
-
热力图(heatmap):查看变量相关性
# 相关性热力图
corr = df.corr()
sns.heatmap(corr, annot=True, cmap="coolwarm")
plt.title("变量相关性")
plt.show()
五、总结对比
特性 | Matplotlib | Seaborn |
---|---|---|
适用范围 | 基础绘图、完全自定义 | 统计类图表、快速绘图 |
美观性 | 较基础,需要手动美化 | 默认风格美观 |
学习曲线 | 相对较陡 | 简洁易用 |
功能覆盖 | 低层控制、多种图表类型 | 高层封装,部分依赖 pandas 数据结构 |
六、小结要点
-
Matplotlib 提供底层控制,适合自定义复杂图形;
-
Seaborn 提供更高层次接口,适合数据分析与统计可视化;
-
推荐:数据探索初期优先使用 Seaborn,需精细定制时再用 Matplotlib;
-
掌握基本图表类型:折线图、柱状图、散点图、箱线图、热力图等。