当前位置：首页 > news >正文

tidyverse-数据可视化 - 图形的分层语法

news 2025/7/21 9:31:19

1. ggplot2 的基本概念

ggplot2 是一个基于 R 的数据可视化包，它基于“图形的分层语法”（grammar of graphics）。这意味着你可以通过组合不同的图层和组件来构建复杂的图形。

核心组件：

数据（Data）：你要可视化的数据集。
美学映射（Aesthetics）：将数据变量映射到图形的视觉属性（如颜色、形状、大小等）。
几何对象（Geometric Objects, Geoms）：决定数据如何显示（如点、线、柱状图等）。
统计变换（Statistical Transformations, Stats）：对数据进行计算或转换（如计数、拟合模型等）。
位置调整（Position Adjustments）：调整几何对象的位置（如堆叠、并排、抖动等）。
坐标系（Coordinate Systems）：决定数据在图形中的位置和比例（如笛卡尔坐标系、极坐标系等）。
刻面（Facets）：将数据拆分为多个子图，便于比较不同子集。
主题（Theme）：控制图形的整体外观（如字体、颜色、背景等）。

2. 美学映射（Aesthetics）

美学映射是将数据变量映射到图形的视觉属性。例如，你可以将一个数值变量映射到 x 轴，另一个数值变量映射到 y 轴，还可以将分类变量映射到颜色或形状。

示例代码：

library(ggplot2)# 数据集 mpg
ggplot(mpg, aes(x = displ, y = hwy, color = class)) + geom_point()  # 使用颜色美学映射

解释：

ggplot(mpg, aes(x = displ, y = hwy, color = class))：
- mpg 是数据集。
- aes() 定义了美学映射：displ 映射到 x 轴，hwy 映射到 y 轴，class 映射到颜色。
geom_point()：添加点几何对象，绘制散点图。

3. 几何对象（Geometric Objects）

几何对象决定了数据如何显示。不同的几何对象可以揭示数据的不同特征。

示例代码：

# 散点图
ggplot(mpg, aes(x = displ, y = hwy)) + geom_point()  # 点几何对象# 平滑曲线图
ggplot(mpg, aes(x = displ, y = hwy)) + geom_smooth()  # 平滑曲线几何对象

解释：

geom_point()：绘制散点图。
geom_smooth()：绘制平滑曲线，用于显示数据的趋势。

4. 刻面（Facets）

刻面用于将数据拆分为多个子图，便于比较不同子集。

示例代码：

# 根据 cyl 分面
ggplot(mpg, aes(x = displ, y = hwy)) + geom_point() +facet_wrap(~ cyl)  # 单变量分面# 根据 drv 和 cyl 分面
ggplot(mpg, aes(x = displ, y = hwy)) + geom_point() +facet_grid(drv ~ cyl)  # 双变量分面

解释：

facet_wrap(~ cyl)：根据 cyl 变量将数据拆分为多个子图。
facet_grid(drv ~ cyl)：根据 drv 和 cyl 的组合将数据拆分为多个子图。

5. 统计变换（Statistical Transformations）

统计变换用于对数据进行计算或转换。例如，geom_bar() 默认使用 stat_count 计算每个类别的计数。

示例代码：

# 条形图
ggplot(diamonds, aes(x = cut)) + geom_bar()  # 默认使用 stat_count# 自定义统计变换
ggplot(diamonds, aes(x = cut, y = after_stat(prop), group = 1)) + geom_bar()  # 显示比例而不是计数

解释：

geom_bar()：默认使用 stat_count 计算每个类别的计数。
after_stat(prop)：使用统计变换计算比例。

6. 位置调整（Position Adjustments）

位置调整用于控制几何对象的位置，避免重叠或更好地展示数据。

示例代码：

# 堆叠条形图
ggplot(mpg, aes(x = drv, fill = class)) + geom_bar()  # 默认堆叠# 并排条形图
ggplot(mpg, aes(x = drv, fill = class)) + geom_bar(position = "dodge")  # 并排显示# 抖动散点图
ggplot(mpg, aes(x = displ, y = hwy)) + geom_jitter()  # 避免点重叠

解释：

position = "dodge"：将重叠的对象并排放置。
geom_jitter()：在散点图中添加随机噪声，避免数据点重叠。

7. 坐标系（Coordinate Systems）

坐标系决定了数据在图形中的位置和比例。

示例代码：

# 极坐标
ggplot(diamonds, aes(x = clarity, fill = clarity)) + geom_bar() +coord_polar()  # 使用极坐标

解释：

coord_polar()：将数据转换为极坐标，可用于绘制饼图或 Coxcomb 图。

8. 练习

现在，让我们通过一些练习来巩固这些知识！

练习 1：创建一个散点图，将 `mpg` 数据集中的 `displ` 映射到 x 轴，`hwy` 映射到 y 轴，并将 `class` 映射到颜色。

ggplot(mpg, aes(x = displ, y = hwy, color = class)) + geom_point()

练习 2：创建一个条形图，显示 `diamonds` 数据集中不同 `cut` 的数量。

ggplot(diamonds, aes(x = cut)) + geom_bar()

练习 3：根据 `drv` 和 `cyl` 分面，创建一个散点图。

ggplot(mpg, aes(x = displ, y = hwy)) + geom_point() +facet_grid(drv ~ cyl)

练习 4：创建一个平滑曲线图，并将 `drv` 映射到线型。

ggplot(mpg, aes(x = displ, y = hwy, linetype = drv)) + geom_smooth()

练习 5：创建一个饼图，显示 `diamonds` 数据集中不同 `clarity` 的比例。

ggplot(diamonds, aes(x = "", fill = clarity)) + geom_bar(width = 1) +coord_polar(theta = "y")

总结

通过这些示例和练习，你应该能够理解 ggplot2 的基本概念，并能够创建各种类型的图形。如果你有任何问题，随时问我！

查看全文

http://www.dtcms.com/a/289327.html

论文分享（一）

C++ primer知识点总结

LVS-----TUN模式配置

Docker-compose-知识总结

基于单片机倾角测量仪/角度测量/水平仪

双8无碳小车“cad【17张】三维图＋设计说名书

【HarmonyOS】ArkUI - 自定义组件和结构重用

【pandoc实践】如何将wordpress文章批量导出为Markdown格式

神经网络：卷积层

使用UV管理PyTorch项目

PyTorch常用的简单数学运算

Paimon INSERT OVERWRITE

一维数组练题习~

PyTorch的基础概念和复杂模型的基本使用

【软件测试】从软件测试到Bug评审：生命周期与管理技巧

ESXi6.7硬件传感器红色警示信息

ICT模拟零件测试方法--测量参数详解

ThinkPHP8极简上手指南：开启高效开发之旅

基于机器视觉的迈克耳孙干涉环自动计数系统设计与实现

STM32CubeMX的一些操作步骤的作用

拼写纠错模型Noisy Channel（下）

机器学习理论基础 - 核心概念篇

复杂度优先：基于推理链复杂性的提示工程新范式

Linux操作系统之线程（四）：线程控制

20250720-1-Kubernetes 调度-白话理解创建一个Pod的内部工作流_笔记

Qt的安装和环境配置

Ubuntu挂载和取消挂载

【vue-7】Vue3 响应式数据声明：深入理解 reactive()

Matlab自学笔记六十四：求解自变量带有约束条件的方程

相同问题的有奇点模型和无奇点模型有什么区别

1. ggplot2 的基本概念

核心组件：

2. 美学映射（Aesthetics）

示例代码：

解释：

3. 几何对象（Geometric Objects）

示例代码：

解释：

4. 刻面（Facets）

示例代码：

解释：

5. 统计变换（Statistical Transformations）

示例代码：

解释：

6. 位置调整（Position Adjustments）

示例代码：

解释：

7. 坐标系（Coordinate Systems）

示例代码：

解释：

8. 练习

练习 1：创建一个散点图，将 mpg 数据集中的 displ 映射到 x 轴，hwy 映射到 y 轴，并将 class 映射到颜色。

练习 2：创建一个条形图，显示 diamonds 数据集中不同 cut 的数量。

练习 3：根据 drv 和 cyl 分面，创建一个散点图。

练习 4：创建一个平滑曲线图，并将 drv 映射到线型。

练习 5：创建一个饼图，显示 diamonds 数据集中不同 clarity 的比例。

总结

相关文章：

练习 1：创建一个散点图，将 `mpg` 数据集中的 `displ` 映射到 x 轴，`hwy` 映射到 y 轴，并将 `class` 映射到颜色。

练习 2：创建一个条形图，显示 `diamonds` 数据集中不同 `cut` 的数量。

练习 3：根据 `drv` 和 `cyl` 分面，创建一个散点图。

练习 4：创建一个平滑曲线图，并将 `drv` 映射到线型。

练习 5：创建一个饼图，显示 `diamonds` 数据集中不同 `clarity` 的比例。