当前位置: 首页 > news >正文

计算机专业课《大数据技术》课程导览:开启数据智能时代

课程定位
《大数据技术》是计算机科学与技术、人工智能等专业的核心课程,聚焦海量数据的采集、存储、处理与分析技术。课程以分布式系统理论为基础,结合行业主流框架,培养学生解决实际数据密集型问题的能力。


技术体系全景

  1. 数据存储层

    • 分布式文件系统:$HDFS$(Hadoop Distributed File System)
    • NoSQL数据库:$Cassandra$、$HBase$
    • 云存储技术:$Amazon S3$、$Azure Blob Storage$
  2. 计算引擎层

    • 批处理框架:$MapReduce$(基础模型)
      $$ \text{Map}(k1,v1) \rightarrow \text{list}(k2,v2) \ \text{Reduce}(k2,\text{list}(v2)) \rightarrow \text{list}(v3) $$
    • 流处理框架:$Spark Streaming$、$Flink$
    • 交互式查询:$Presto$、$Impala$
  3. 数据分析层

    • 数据挖掘工具:$MLlib$(Spark机器学习库)
    • 可视化平台:$Tableau$、$Power BI$

核心能力培养

  1. 分布式系统设计

    • CAP定理:$ \text{一致性}(Consistency) \cap \text{可用性}(Availability) \cap \text{分区容错}(Partition\ tolerance) $ 三选二
http://www.dtcms.com/a/391681.html

相关文章:

  • dumpsys battery 简介
  • 从 CNN 基础到 AlexNet:计算机视觉的破局之路
  • 苏州自动化工厂1台服务器如何5人并发SolidWorks设计
  • 固态硬盘数据恢复一般多少钱?费用分析+恢复教程
  • WebRTC 探秘:构建你自己的实时视频应用
  • 在Ubuntu中离线安装miniconda3
  • Mem0 + 百度智能云向量数据库:为AI打造持久化记忆
  • MySQL 数据归档的技术困境与 Databend 解决之道
  • 2025icpc网络赛第一场The 2025 ICPC Asia East Continent Online Contest (I)
  • docker中ngnix的路径配置
  • 什么是黑板架构风格?
  • Redis 三大核心模式(主从复制 / 哨兵 / 集群):完整部署与问题解析
  • Docker生产环境容器OOM问题定位:镜像内存泄漏还是主机资源不足?
  • AcWing385. GF和猫咪的玩具——Floyd算法
  • 75、封装paddle ocr v5服务支持昇腾800 900 、800I A2、300I DUO卡推理识别
  • 【一文了解】线程的使用
  • 电力系统暂态稳定计算与单机无穷大系统建模
  • OmniGen2 - 智源研究院推出的开源多模态生成模型
  • 【故障排查:JDK8中Files.lines方法错误使用导致的Linux服务器文件描述符泄漏问题】
  • 【multisim仿真电子秒表74LS90】2022-12-15
  • v-show 和 v-if 的区别及使用场景
  • 动态二维码杜绝代签,手机端配置同步,巡检数据更可靠
  • 数据库学习MySQL系列6、MySQL入门简单练习使用
  • 交互式生成对抗网络(iGAN)
  • RecSys: 推荐系统重排与多样性优化(MMR以及DPP算法)
  • 瑞芯微MPP音视频框架---mjpeg解码
  • 模型部署:(七)安卓端部署OCR文本识别项目全流程记录
  • 用html5写一个超级计算器
  • 手机实现真随机数生成器
  • 119.计数器产生中断(上升沿)计算方法,比如cnt[21:0],那么assign time = cnt[20]这样大致是多长时间产生一次中断