当前位置: 首页 > news >正文

Python----数据可视化(Seaborn二:绘图一)

常见方法

  • barplot方法 单独绘制条形图

  • catplot方法 可以条形图、散点图、盒图、小提亲图、等

  • countplot方法 统计数量

一、柱状图

seaborn.barplot(data=None,  x=None, y=None, hue=None, color=None, palette=None)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
color用于变量的不同级别的颜色。应该 可以是可以解释的 ,或者是 字典将色调级别映射到 matplotlib 颜色。
palette用于绘制填充颜色的原始饱和度的比例。大 面片通常使用不饱和的颜色看起来更好,但如果您希望颜色与输入值完美匹配,请将其设置为。1

1.1、常规柱状图

import seaborn as sns
import pandas as pd
# 示例数据
tips=pd.read_csv('tips.csv')
# 单变量柱状图
sns.barplot(x="day", y="total_bill", data=tips)
# 显示图表
plt.show()

1.2、横向条形图

import seaborn as sns
import pandas as pd
# 示例数据
tips=pd.read_csv('tips.csv')
# 单变量柱状图
sns.barplot(x="total_bill", y="day", data=tips)
# 显示图表
plt.show()

1.3、分组条图

import seaborn as sns
import pandas as pd
# 示例数据
tips=pd.read_csv('tips.csv')
import seaborn as sns
# 分组柱状图
sns.barplot(x="day", y="total_bill", hue="sex", data=tips)
# 显示图表
plt.show()

1.4、设置颜色

import seaborn as sns
# 示例数据
tips=pd.read_csv('tips.csv')
# 设置颜色
sns.barplot(x="day", y="total_bill", data=tips,color='salmon')
sns.barplot(x="day", y="total_bill", hue="sex", data=tips,palette='dark:salmon')
# 显示图表
plt.show()

1.5、 统计数量

seaborn.countplot(data=None, *, x=None, y=None, hue=None, color=None, palette=None)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
color用于变量的不同级别的颜色。应该 可以是可以解释的 ,或者是 字典将色调级别映射到 matplotlib 颜色。
palette用于绘制填充颜色的原始饱和度的比例。大 面片通常使用不饱和的颜色看起来更好,但如果您希望颜色与输入值完美匹配,请将其设置为。1
import seaborn as sns 
import matplotlib.pyplot as plt 
import pandas as pd 


tips = pd.read_csv('tips.csv')  

# 通过按天数对数据进行分组并计数
# display(tips.groupby('day').count())  

# 使用ountplot 方法绘制当天小费数量的条形图  
sns.countplot(x="day", data=tips)  

# 显示绘制的图形  
plt.show()

二、直方图

方法

  • histplot方法 绘制单变量或双变量直方图来显示数据集的分布

  • displot方法 绘制直方图、核密度图。可以比较多个变量分布情况

seaborn.histplot(data=None,x=None, y=None, hue=None, bins='auto',multiple='layer', element='bars',  kde=False, palette=None,color=None)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
color用于变量的不同级别的颜色。应该 可以是可以解释的 ,或者是 字典将色调级别映射到 matplotlib 颜色。
palette用于绘制填充颜色的原始饱和度的比例。大 面片通常使用不饱和的颜色看起来更好,但如果您希望颜色与输入值完美匹配,请将其设置为。1
bins通用 bin 参数,可以是引用规则的名称, 分箱数或分箱的分隔线。
multiple

语义映射创建子集时解析多个元素的方法。 仅与单变量数据相关。

{“layer”, “减淡”, “stack”, “fill”}

elment

直方图统计量的可视化表示形式。 仅与单变量数据相关。

{“bars”, “step”, “poly”}

seaborn.displot(data=None, *, x=None, y=None, hue=None, row=None, col=None, weights=None, kind='hist', rug=False, rug_kws=None, log_scale=None, legend=True, palette=None, hue_order=None, hue_norm=None, color=None, col_wrap=None, row_order=None, col_order=None, height=5, aspect=1, facet_kws=None, **kwargs)
row定义子集以在不同 facet 上绘制的变量。
col定义子集以在不同 facet 上绘制的变量。

2.1、常规直方图

sns.histplot(tips['total_bill'])

 

sns.displot(tips['total_bill'])

2.2、核密度估计

        核密度估计的作用是用来估计概率密度函数的,它可以用来描述随机变量的密度分布

sns.histplot(tips['total_bill'],kde=True)
sns.displot(tips['total_bill'], kde=True)

 

2.3、多变量直方图

multiple='layer' # 默认值,以层叠的形式展示
multiple='dodge' # 以并列的形式展示
multiple='stack' # 以堆叠的形式展示
multiple='fill' # 以百分比堆叠的形式展示
sns.histplot(x='total_bill', hue='sex', data=tips)

 

sns.histplot(x='total_bill', hue='sex', data=tips, multiple='stack')

 

sns.histplot(x='total_bill', hue='sex', data=tips, multiple='dodge')

 

sns.histplot(x='total_bill', hue='sex', data=tips, multiple='fill')

 

2.4、修改一些参数

sns.histplot(x='total_bill', data=tips, bins=20, color='skyblue', edgecolor='black', linewidth=1.2)
sns.displot(x='total_bill', data=tips, bins=20, color='skyblue', edgecolor='black', linewidth=1.2)

 

2.5、 累积直方图

sns.histplot(x='total_bill', data=tips, element='step')
sns.displot(x='total_bill', data=tips, element='step',col='time')

 

三、折线图

方法

  • lineplot方法 单独绘制折线图

  • relplot方法 绘制折线图、散点图

seaborn.lineplot(data=None, x=None, y=None, hue=None)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
seaborn.relplot(data=None, *, x=None, y=None, hue=None, row=None, col=None kind='scatter')
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
row定义子集以在不同 facet 上绘制的变量。
col定义子集以在不同 facet 上绘制的变量。
kind要绘制的情节类型,对应于 seaborn 关系情节。 选项包括 或 。"scatter""line"
sns.lineplot(x=[1,2,3,4,5],y=[1,2,3,4,5])
sns.relplot(x=[1,2,3,4,5],y=[1,2,3,4,5],kind='line')

import seaborn as sns
# 示例数据
tips = pd.read_csv('tips.csv')  


sns.lineplot(x="day", y="total_bill", data=tips)
sns.relplot(x="day", y="total_bill", data=tips, kind='line')


# 多变量折线图
sns.lineplot(x="day", y="total_bill", data=tips,hue='time')
sns.relplot(x="day", y="total_bill", data=tips,hue='time',kind='line')


# 使用relplot绘制折线图
sns.relplot(x="day", y="total_bill", data=tips,
      kind='line',# 图像类型
      hue='sex',# 分类变量
      col='time') # 分图变量

 

四、散点图

方法

  • scatterplot方法 主要用于绘制两个数值变量之间的散点图

  • relplot方法 可以绘制多种类型的关系图,包括散点图

seaborn.scatterplot(data=None, x=None, y=None, hue=None)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
seaborn.relplot(data=None, *, x=None, y=None, hue=None, row=None, col=None kind='scatter')
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
row定义子集以在不同 facet 上绘制的变量。
col定义子集以在不同 facet 上绘制的变量。
kind要绘制的情节类型,对应于 seaborn 关系情节。 选项包括 或 。"scatter""line"
import seaborn as sns


# 加载数据
tips=pd.read_csv('tips.csv')
# 常规散点图
sns.scatterplot(data=tips,x='total_bill', y='tip')
sns.relplot( data=tips, x='total_bill', y='tip',kind='scatter')
# 多组散点图
sns.scatterplot(data=tips,x='total_bill', y='tip', hue='smoker')
sns.relplot(data=tips,x='total_bill', y='tip', hue='smoker')
# 多变量散点图
sns.relplot(data=tips,x='total_bill', y='tip', hue='smoker',col='time')

 

五、分散散点图

方法

  • stripplot方法 利用抖动功能绘制分类散点图,以减少过度绘图

  • swarmplot方法 绘制分类散点图,并将点调整为不重叠

  • catplot方法 可以绘制以上2种图,并且可以分图

seaborn.stripplot(data=None, *, x=None, y=None, hue=None,dodge=False)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
dodge当一个变量被赋值时,将其设置为 will 沿分类分隔不同色相级别的条带 轴并缩小分配给每个条带的空间量。否则 每个级别的点将绘制在同一条带中。
seaborn.swarmplot(data=None, *, x=None, y=None, hue=None,dodge=False)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
dodge当一个变量被赋值时,将其设置为 will 沿分类分隔不同色相级别的条带 轴并缩小分配给每个条带的空间量。否则 每个级别的点将绘制在同一条带中。
seaborn.catplot(data=None, *, x=None, y=None, hue=None, row=None, col=None, kind='strip')
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
row定义子集以在不同 facet 上绘制的变量。
col定义子集以在不同 facet 上绘制的变量。
kind要绘制的绘图类型对应于分类的名称 轴级绘图功能。选项有: “strip”, “swarm”, “box”, “violin”, “boxen”、“point”、“bar” 或 “count”。
import seaborn as sns
import pandas as pd


tips=pd.read_csv('tips.csv')

sns.catplot(y="total_bill", x="day", data=tips,hue='sex',dodge=True,marker="D",col='smoker')

sns.swarmplot(y="total_bill", x="day", data=tips,hue='sex',marker="v")

 

sns.catplot(y="total_bill", x="day", data=tips,hue='sex',marker="v",col='smoker',kind='swarm')

六、盒图

方法

  • boxplot方法

  • catplot方法

seaborn.boxplot(data=None, *, x=None, y=None, hue=None,fill=True,width=0.8, gap=0,notch=False)
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
fill定义子集以在不同 facet 上绘制的变量。
gap箱体间隔
width箱体宽度
notch箱体是否缺口
seaborn.catplot(data=None, *, x=None, y=None, hue=None, row=None, col=None, kind='strip')
函数描述
data用于绘图的数据集。
x用于绘制长格式数据的输入。
y用于绘制长格式数据的输入。
hue用于绘制长格式数据的输入。对原有的属性进行更加细致的分组
row定义子集以在不同 facet 上绘制的变量。
col定义子集以在不同 facet 上绘制的变量。
kind要绘制的绘图类型对应于分类的名称 轴级绘图功能。选项有: “strip”, “swarm”, “box”, “violin”, “boxen”、“point”、“bar” 或 “count”。
import seaborn as sns
import pandas as pd


tips = pd.read_csv('tips.csv')


sns.boxplot(x="day", y="total_bill", data=tips,hue="smoker",
      fill=False, # 填充箱体,默认为True
      gap=0.1,  # 箱体间隔
      width=0.5, # 箱体宽度
      notch=True # 箱体是否缺口
       )

sns.catplot(x="day", y="total_bill", data=tips,kind="box",col="sex")

 

相关文章:

  • 批量删除 Excel 中的空白行、空白列以及空白表格
  • 算法中的背包问题详解:部分背包与0-1背包
  • git-在ubuntu/debian搭建简易的git服务器
  • ESP32驱动OV3660摄像头实现yoloV5物体分类(摄像头支持红外夜视、边缘AI计算)
  • Axure常用变量及使用方法详解
  • 2-kafka集群环境搭建
  • 循环神经网络(RNN):时序建模的核心引擎与演进之路
  • 特征表示深度解析:颜色、纹理、形状与编码
  • 容器编排革命:从 Docker Run 到 Docker Compose 的进化之路20250309
  • PiscTrace以YOLOv12为例定义兴趣区域提高识视图别效率
  • 在 Windows 上安装和配置 Poetry
  • leecode练习-数组-3.9
  • 慕慕手记项目日记 熟悉SQLAIChemy ORM框架 2025-3-5
  • 软件开发过程总揽
  • 利用LLMs准确预测旋转机械(如轴承)的剩余使用寿命(RUL)
  • 如何将本地已有的仓库上传到gitee (使用UGit)
  • UML面向对象建模与设计 读书笔记
  • Python 数据可视化创意分享:解锁数据之
  • PCIe协议之RCB、MPS、MRRS详解
  • Mysql配置文件My.cnf(my.ini)配置参数说明
  • 义乌至迪拜“铁海快线+中东快航”首发,物流成本降低18%
  • 国际博物馆日|航海博物馆:穿梭于海洋神话与造船工艺间
  • 家国万里·时光故事会|构筑中国船舰钢筋铁骨,她在焊花里展现工匠风范
  • 出走的苏敏阿姨一路走到了戛纳,这块红毯因她而多元
  • 牛市早报|持续推进城市更新行动意见印发,证监会强化上市公司募资监管
  • 贝壳一季度收入增长42%:二手房市场活跃度维持在高位