当前位置: 首页 > news >正文

如何分析和可视化时间序列数据

  • 拒绝感知差异,画出实际差异
  • 虽然它是时间序列数据,但它不一定是折线图
  • 分析并可视化相关性和随时间的变化
  • 扩展

数据的重要特征仅仅可见是不够的,它必须引人注目。

拒绝感知差异,画出实际差异

  • 感知差异:当我们尝试比较折线图中的两条线时,我们通常将差异感知为 线条之间的最短距离

  • 实际差异:但是,特定水平位置处的实际差异是 两条线之间的垂直差异

在这里插入图片描述

  • 画出差异:我们不需要依靠眼睛来填充空间,而是可以 画出垂直标记来明确实际差异

  • 共同基线:此外,通过 将垂直标记放在共同基线上,随着时间的推移,差异变得更容易比较。

在这里插入图片描述

比较两个指标随时间的变化 时,标准做法是 画出两条线并寻找差距。但是,如果差异最为重要,则应将差异可视化,以便清楚了解。

虽然它是时间序列数据,但它不一定是折线图

接下来,展示一位分析师的思维过程和最佳实践,他使用可观察的图表揭示了德克萨斯州能源发电异常激增背后隐藏的模式。

在这里插入图片描述

当深入研究数据集时,能够使用可视化快速生成 不同的视角 会产生很大的不同。

在这里插入图片描述

哪种图表“最好”取决于数据。不同的标记或图表类型揭示了数据的不同方面。

接下来重点介绍 每个图表的有效性如何受到数据本身特征的影响,以及 如何通过一系列细微的调整将基本图表转变为清晰揭示数据最重要方面的图表
在这里插入图片描述

分析并可视化相关性和随时间的变化

如何 评估两个变量随时间的变化关系?有许多方法可以分析相关性,并可视化数据集随时间的变化。

但是,当 需要同时了解时间和相关性时,该怎么办:看看两个指标之间的相关性在不同时间段内如何变化

仅使用颜色标记散点图中的类别 切换到 按类别进行分面。生成的迷你图表(每个时间段一个)揭示了 细微的基于时间的分布模式,而这在标准方法中几乎是不可能看到的。

在这里插入图片描述

参考:How to analyze and visualize time series data

扩展

  1. 堆叠面积图

    在面积图中,多个变量“堆叠”在一起,每条线下方的区域都 用颜色表示每个变量

    下图用堆叠面积图显示了 2001 年至 2010 年印度学生入学时间序列数据。

    在这里插入图片描述

    堆积面积图可用于显示 累计总数总数的各个组成部分 随时间的变化情况。

    变量堆叠的顺序 至关重要,因为实际图表与人类感知有时会有所不同。

  2. 流图

    流图本质上是 堆叠面积图,但 围绕中心水平轴移动。流图看起来像流动的液体,因此得名。

    流图非常适合表示和比较 多个变量时间序列 数据。因此,流图适合大型数据集。请记住,颜色的选择 非常重要,尤其是在变量很多的情况下。如果颜色选择不当,没有明显高值的变量可能会在可视化中被淹没。

    下面是一个流图,显示了随机选择的听众在一段时间内的音乐收听习惯。

    在这里插入图片描述

  3. 带误差带的时间序列图

    在这里插入图片描述

    使用的 seaborn 组件set_theme()load_dataset()lineplot()

    import seaborn as sns
    sns.set_theme(style="darkgrid")
    
    # Load an example dataset with long-form data
    fmri = sns.load_dataset("fmri")
    
    # Plot the responses for different events and regions
    sns.lineplot(x="timepoint", y="signal",
                 hue="region", style="event",
                 data=fmri)
    

    Seaborn 是一个基于 matplotlib 的 Python 数据可视化库。它提供了一个高级界面,用于绘制有吸引力且信息丰富的统计图形。

相关文章:

  • 模拟类似 DeepSeek 的对话
  • HiPixel开源AI驱动的图像超分辨率的原生macOS 应用程序,使用 SwiftUI 构建并利用 Upscayl 强大的 AI 模型
  • 使用谷歌浏览器(chrome)的地址栏搜索白屏
  • 外包干了6天,技术明显退步。。。
  • Docker Compose 容器卷映射:是否需要提前将文件拷贝到宿主机?
  • Linux 匿名管道实现进程池
  • 【瞎折腾/Dify】使用docker离线部署Dify
  • 基于RWA 与 AI-Agent 协同的企业数字化生态构建
  • LLM自动化评测
  • 系统思考:客户价值
  • 1700. 无法吃午餐的学生数量
  • 图的存储、DFS、BFS
  • 基于YOLO11深度学习的舌苔舌象检测识别与诊断系统【python源码+Pyqt5界面+数据集+训练代码】
  • Unity 和 Python 的连接(通过SocketIO)附源码
  • 【栈数据结构应用解析:常见算法题详细解答】—— Leetcode
  • 【春招笔试】2025.03.13-蚂蚁春招笔试题
  • 933. 最近的请求次数
  • 10个数据收集相关DeepSeek提示词
  • 机器学习神经网络中的损失函数表达的是什么意思
  • 基于SpringBoot + Vue 的房屋租赁系统
  • 波兰总统选举第一轮投票结束,出口民调显示将进入第二轮投票
  • 上海青少年书法学习园开园:少年以巨笔书写《祖国万岁》
  • 柬埔寨果农:期待柬埔寨榴莲走进中国市场
  • 倒票“黄牛”屡禁不绝怎么破?业内:强化文旅市场票务公开制度
  • 戛纳打破“疑罪从无”惯例,一法国男演员被拒之门外
  • 梅花奖在上海|舞剧《朱鹮》,剧里剧外都是生命的赞歌