当前位置: 首页 > news >正文

项目2 数据可视化--- 第十五章 生成数据

数据分析是使用代码来探索数据内的规律和关联。

数据可视化是通过可视化表示来 探索和呈现数据集内的规律。

好的数据可视化,可以发现数据集中未知的规律和意义。

一个流行的工具是Matplotlib,他是一个数据绘图库;

还有Plotly包,这个包生成的图形非常适合在数字设备上显示——不仅能根据显示设备的尺寸自动调整大小,还具备众多交互特性,如在用户将鼠标指向图形的不同区域时,突出显示数据集的相应特征。

15.1  安装Matplotlib

python -m pip install --user matplotlib

15.2 绘制简单的折线图

fig相当于一个大图片窗口;ax 相当于里面的线 内容。 

  1. fig ,ax =plt.subplots()
  2. plt.plot(数据参数) 
  • #创建窗口和图 subplots()

    fig, ax = plt.subplots()

    #ax图调用plot方法 传入数据参数

    ax.plot(input_values, squares, linewidth=3)

 15.2.1 修改标签文字和线条粗细

1.添加图题并给坐标轴加上标签

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]

fig, ax = plt.subplots()
#linewidth 设置线条粗细
ax.plot(squares, linewidth=3)

# 设置图题并给坐标轴加上标签
ax.set_title("Square Numbers", fontsize=24)
ax.set_xlabel("Value", fontsize=14)
ax.set_ylabel("Square of Value", fontsize=14)

# 设置刻度标记的样式,将刻度标签字体大小设置为 14
ax.tick_params(labelsize=14)

plt.show()

15.2.2 校正绘图

图更清楚了 标题字大了,但是,数据绘制的并不正确。

折线图的终点 4的平方为25。

可给plot同时提供输入值和输出值。

 marker='o')

import matplotlib.pyplot as plt
#相当于给横纵坐标对应的点了
input_values = [1, 2, 3, 4, 5]
squares = [1, 4, 9, 16, 25]

#1.调用subplots()函数方法
fig, ax = plt.subplots()
#2.调用plot方法 传入数据列表当做数据参数    marker='o'整个小圆点更容易看出点
ax.plot(input_values, squares, linewidth=3 ,marker='o')

# Set chart title and label axes.
ax.set_title("Square Numbers", fontsize=24)
ax.set_xlabel("Value", fontsize=14)
ax.set_ylabel("Square of Value", fontsize=14)

# Set size of tick labels.
ax.tick_params(labelsize=14)

plt.show()

15.2.3 使用内置样式

 Matplotlib提供很多已经定义好的样式,这些样式包含默认的背景色、网格线、线条粗细、字体和字号等设置,我们无需做太多定制就能有不错的可视化效果。看我们系统中使用的所有样式,可以在终端进入python 再输入:

import matplotlib.pyplot as plt

 

15.2.4 使用scatter()绘制散点图并设置样式

 有时候, 需要绘制散点图并设置各个数据点的样式。

可以想一个颜色显示数值小的数据,另一个颜色显示数值大的数据。

在绘制大数据模型时,还可先对每个点都设置同样的样式,再使用不同的样式重新描绘某些点,突出某些点。

绘制单个点,可以使用scatter()方法,并向它传递该点的xy轴坐标值。

 绘制一系列的散点

15.2.6 自动计算数据

比如计算平方数 

相当于 x轴给值 ,y轴给平方值。

# axis方法设置每个坐标轴的取值范围
# 四个参数分别是 x的最小和最大;y轴的最小和最大值
ax.axis([0, 1100, 0, 1_100_000])

15.2.7 定制刻度标记

没啥用 plain

可以覆盖默认的刻度标记样式

 

15.2.8 定制颜色

15.2.9 使用颜色映射

是一个从起始颜色渐变到结束颜色的颜色序列,在可视化中,颜色映射用于突出数据的规律。

用较浅的颜色来显示较小的值,使用较深的颜色来显示较大的值。

使用颜色映射,可根据精心设计的色标准确的设置所有点的颜色。

ax.scatter(x_values, y_values, s=1,color ='red',marker='o')

ax.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues, s=10)

ax.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Reds_r, s=10)

了解其他颜色映射

Matplotlib — Visualization with Python

 

15.2.10 自动保存绘图


import os
# 获取当前脚本所在的目录
script_dir = os.path.dirname(os.path.abspath(__file__))
# 将当前工作目录切换到脚本所在目录
os.chdir(script_dir)

import matplotlib.pyplot as plt

x_values = range(1, 1001)
y_values = [x**2 for x in x_values]

# plt.style.use('seaborn')
plt.style.use('seaborn-v0_8')
fig, ax = plt.subplots()
ax.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues, s=10)

# Set chart title and label axes.
ax.set_title("Square Numbers", fontsize=24)
ax.set_xlabel("Value", fontsize=14)
ax.set_ylabel("Square of Value", fontsize=14)

# Set size of tick labels.
ax.tick_params(labelsize=14)

# Set the range for each axis.
ax.axis([0, 1100, 0, 1_100_000])
ax.ticklabel_format(style='plain')

# plt.show()
#第一个参数 命名图片         第二个参数 将绘图多余的空白区域裁剪掉
# 这个图片会存储到当前py文件的同目录下
plt.savefig('picture.png',bbox_inches= 'tight')

 路径变成当前目录下!!!!!
import os
# 获取当前脚本所在的目录
script_dir = os.path.dirname(os.path.abspath(__file__))
# 将当前工作目录切换到脚本所在目录
os.chdir(script_dir)

 

 15.3 随机游走

15.4 使用Plotly 模拟掷骰子

使用Plotly来生成交互式图形。

当需要创建在浏览器中显示的图形时,它生成的图形将自动缩放,以适应观看者的屏幕。

交互式:当用户将鼠标指向特定元素,将显示有关该元素的信息。将使用Plotly Express来创建初始图形。

Plotly Express是plotly的子集,使用尽可能少的代码生成绘图。

我们先使用几行代码生成初始绘图,在确定输出正确之后再使用matplotlib那样对绘图进行定制。

15.4.1 安装plotly

python -m pip install --user plotly

Plotly Express依赖于pandas(一个高效处理数据的库),需要再安装pandas

python -m pip install --user pandas

 

1.创建die类 

2.掷筛子 

3. 分析结果 

# Analyze the results.
frequencies = []
poss_results = range(1, die.num_sides+1) #range(1,6)输出的是1 2  3 4 5,所以range要加1
for value in poss_results:
    frequency = results.count(value) #计算每个点出现的次数
    frequencies.append(frequency)  #加到空列表里的末尾

 

 4.绘制直方图

 5.定制绘图

# Visualize the results.
title = "Results of Rolling One D6 1,000 Times"
labels = {'x': 'Result', 'y': 'Frequency of Result'}
fig = px.bar(x=poss_results, y=frequencies, title=title, labels=labels)
fig.show()

6. 当条形太多,x轴默认布局没有加上标签

 

6.保存图形 

相关文章:

  • Golang | 每日一练 (2)
  • 全面理解-c++的auto自动类型推导
  • MongoDB数据库使用及常见问题
  • 1.力扣热题100
  • 【ARM 开发】理解 BootROM:从底层启动到安全部署的指南
  • iOS 上自定义编译 FFmpeg
  • 【c++】c++内存管理
  • LeetCode 1287.有序数组中出现次数超过25%的元素:遍历
  • 20250214 随笔 Nginx 负载均衡在数据库中的应用
  • 车辆路径问题(VRP)分支定价算法中的分支策略
  • 【C++ 算法竞赛函数速查表】
  • Leetcode 3458. Select K Disjoint Special Substrings
  • 算法学习036 C++最长上升子序列LIS 动态规划DP算法实现最长上升子序列 中小学算法思维学习 比赛算法题解 信奥算法解析
  • Wireshark 输出 数据包列表本身的值
  • SpringBoot中集成SaToken
  • vue3开发打年兽功能
  • 【论文笔记】On Generative Agents in Recommendation
  • DeepSeek 本地部署方法介绍
  • 鸡兔同笼问题
  • 20.【线性代数】——坐标系中,平行四边形面积=矩阵的行列式
  • 泽连斯基:俄代表团级别低,没人能做决定
  • 马上评|训斥打骂女儿致死,无暴力应是“管教”底线
  • 《日出》华丽的悲凉,何赛飞和赵文瑄演绎出来了
  • “朱雀玄武敕令”改名“周乔治华盛顿”?警方称未通过审核
  • 浙江省台州市政协原副主席林虹被“双开”
  • 共建医学人工智能高地,上海卫健委与徐汇区将在这些方面合作