当前位置: 首页 > news >正文

数据分析的基本步骤

了解过数据分析的概念之后,我们再来说下数据分析的常规步骤。

明确目标

首先我们要确定一个目标,即我们要从数据中得到什么。比如我们要看某个指标A随时间的变化趋势,以期进行简单的预测。

数据收集

当确定了目标之后,就有了取数的方向。比如我们要观察A随时间的变化,就要记录A的值。或者从已经记录了A的值的数据库、文件、日志等取数。

数据清洗和预处理

有时候我们收集的数据并不是完全有效的,或者并不能为我们的服务。这个时候就需要把这部分数据剔除。或者有时候我们收集到的是文本数据,需要做一下归类,使用数字等符号来做替代,方便做数据的相关性分析,这个时候就需要对数据左小处理。

探索性数据分析(EDA)

使用统计图表来多维度展示数据,更直观地去查看数据地特征。

数据分析和建模

选择适当的数据分析方法和建模技术,来将得到地结论模型化。比如把折线图拟合成曲线。

评估模型

使用测试数据测试模型,评估模型准确性。

利用模型

利用模型做一些数据预测,支撑我们目标之上地目标。

相关文章:

  • 集成测试如何做?
  • 云原生之深入解析云原生架构的日志监控
  • 【LeetCode刷题笔记(6-1)】【Python】【三数之和】【哈希表】【中等】
  • IDEA debug窗口左边工具栏隐藏与显示
  • 【答案】2023年国赛信息安全管理与评估第三阶段夺旗挑战CTF(网络安全渗透)
  • 【AI】如何准备mac开发vue项目的环境
  • 网络基础(五):网络层协议介绍
  • Makefile基本指令
  • 『npm』一条命令快速配置npm淘宝国内镜像
  • Vue2面试题:说一下路由模式hash和history的区别?
  • JVM调优:参数(学习笔记)
  • vue表单输入绑定
  • 考研真题数据结构
  • 利用闭包与高阶函数实现缓存函数的创建
  • 如何部署自己的服务渲染页面为Pdf文档
  • Python:用python脚本,自动翻阅Andriod手机小说
  • EasyExcel处理表头的缓存设置
  • 如何处理好面试中的“压力测试”?
  • 全栈开发组合
  • 租一台服务器多少钱决定服务器的价格因素有哪些
  • 夜读丨古代有没有近视眼?
  • 硅料巨亏后弘元绿能割肉求生:逾12亿元内蒙古公司股权转让协鑫
  • 国家主席习近平同普京总统签署关于进一步深化中俄新时代全面战略协作伙伴关系的联合声明
  • 上海优化营商环境十大攻坚突破任务中,为何第一项是实施世行对标改革?
  • 中国德国商会报告:76%在华德企受美国关税影响,但对华投资战略依然稳固
  • 五月A股怎么买?券商金股电子权重第一,格力电器最热