当前位置: 首页 > news >正文

SYSU-大数据原理与技术-课程知识点-第一章概述

第一部分:数据科学与工程背景

1.1 数据科学与工程的形成

(1)产生背景

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(2)经典案例分析

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

1.2 数据科学与工程的概述

(1)内涵式定义

在这里插入图片描述
在这里插入图片描述

(2)基本方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3 与其他相关领域的关系

(1)与数学的关系

在这里插入图片描述

(2)与统计学的关系

在这里插入图片描述

(3)与计算机科学的关系

在这里插入图片描述

(4)与软件工程的关系

在这里插入图片描述

(5)与数据挖掘的关系

在这里插入图片描述

(6)与人工智能的关系

在这里插入图片描述

1.4 数据科学与工程的重要性

在这里插入图片描述

第二部分:数据科学与工程的工具与技术

2.1 常用工具与技术

(1)数据库管理系统

数据库管理系统是用于创建、管理和查询数据库的软件。它们在数据科学和数据工程中扮演着核心角色,负责数据的持久化存储和高效检索:
在这里插入图片描述
在这里插入图片描述

(2)分布式计算框架

分布式计算框架用于处理大规模数据集,能够在多个节点上并行处理数据,提高计算效率和处理能力:
在这里插入图片描述
在这里插入图片描述

(3)编程语言

编程语言是数据科学家和数据工程师进行数据处理、分析和建模的重要工具:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(4)机器学习库

机器学习库提供了构建和训练机器学习模型的工具和函数,帮助数据科学家在不同的应用场景中实现智能化数据处理:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 本书用到的工具与技术导览

在这里插入图片描述

第三部分:数据科学与工程面临的挑战

3.1 数据隐私和安全

(1)数据隐私

在这里插入图片描述

(2)数据安全

在这里插入图片描述

3.2 道德、伦理与法律问题

(1)数据知识产权归属

在这里插入图片描述

(2)道德和伦理原则

在这里插入图片描述

3.3 数据质量和治理

(1)数据质量

在这里插入图片描述

(2)数据治理

在这里插入图片描述

相关文章:

  • git的坑
  • Nginx 缓存清理
  • 【CF】Day1
  • python监控系统资源使用率并钉钉报警脚本
  • C++:string容器(上篇)
  • DeepSeek与浏览器自动化AI Agent构建指南
  • 【Leetcode 每日一题】2597. 美丽子集的数目
  • P10周:Pytorch实现车牌识别
  • 编译Telegram Desktop
  • Flutter——最详细原生交互(MethodChannel、EventChannel、BasicMessageChannel)使用教程
  • Odoo 企业版用户实施手册 第二章 Odoo 实施方法论 2.4 企业需求分析和目标定义
  • 100天精通Python(爬虫篇)——第115天:爬虫在线小工具_Curl转python爬虫代码工具(快速构建初始爬虫代码)
  • 国产编辑器EverEdit - 宏功能介绍
  • deepseek 3FS编译
  • 音视频入门基础:RTP专题(14)——FFmpeg源码中,对H.264的各种RTP有效载荷结构的解析
  • 【C++】:多态
  • redis的淘汰策略
  • Linux15-epoll、数据库
  • k8s概念及k8s集群部署(Centos7)
  • 基于 Python 实现问卷数据分析的详细示例
  • 有什么免费ppt模板网站/百度竞价被换着ip点击
  • 外贸网站建设 福田/网站制作郑州
  • 网站系统建设需要什么资质/怎么做一个属于自己的网站
  • 贾汪网站建设/网上宣传方法有哪些
  • 新手网站建设/电脑培训班电脑培训学校
  • 长沙哪家公司做网站好/莱阳seo外包