当前位置: 首页 > news >正文

大数据与云计算知识点

一、云计算核心要点
1. 定义
云计算是基于互联网的动态易扩展、虚拟化资源交付模式,按使用量付费,用户可按需访问含网络、服务器、存储等的计算资源共享池,且无需过多管理干预(美国国家标准与技术研究院NIST定义)。

2. 核心特征
- 自我服务:用户可自主调配资源,无需依赖服务方人工操作
- 按量付费:根据实际资源使用量结算,降低闲置成本
- 弹性架构:支持资源灵活扩展与收缩,适配业务波动需求

3. 核心优势
- 节省硬件采购与维护成本
- 减少软件许可费用
- 降低运维团队人力开支
- 优化系统能耗

4. 两大分类模式
| 分类维度 | 具体类型 | 特点 |
| 资源归属 | 私有云 | 部署于企业内部,仅面向内部员工使用 |
|  | 公有云 | 面向互联网大众,提供开放资源服务 |
|  | 混合云 | 融合私有云与公有云,兼顾安全与扩展 |
| 服务模式 | IaaS(基础设施即服务) | 提供基础硬件资源(如网盘、阿里云主机、EC2) |
|  | PaaS(平台即服务) | 提供开发与运行平台(如Google Appspot、百度BAE) |
|  | SaaS(软件即服务) | 提供直接可用软件应用(如搜索引擎、地图、电商平台) |
|  | DaaS(数据即服务) | 提供数据查询、分析等数据服务 |

5. 关键技术
- 分布式计算与存储:通过计算集群、存储集群提升处理能力与容量
- 虚拟化技术:细粒度划分计算资源,提高利用率、降低成本
- 自动运维技术:实现集群机器自动部署、故障节点自动剔除
- 计费模式:与业务场景绑定,是云计算商业化核心难点6. 起源与主流平台
- 起源:亚马逊AWS(含S3存储、EC2虚拟计算等)是云计算商业化开端,核心推动者为亚马逊CTO Werner Vogels
- 主流平台:
- OpenStack:开源(Apache许可),含Nova(虚拟服务器部署)、Swift(分布式存储)模块
- CloudStack:开源,隶属Apache基金会顶级项目
- Eucalyptus:源于高校研究,已商业化
- VMware:非开源收费,侧重企业级虚拟化

 二、大数据核心要点
1. 起源
- 技术源头:Google的GFS(分布式文件系统)、Map-Reduce(并行计算框架)、Big Table(分布式数据库)奠定基础
- 关键项目:Doug Cutting主导的Hadoop,是大数据核心开源框架

2. Hadoop 2.0核心组件
| 组件 | 功能 |
| HDFS | 分布式文件系统,提供高可靠、高扩展、高吞吐的海量数据存储 |
| YARN | 集群资源调度器,统一管理计算资源,支撑多任务并行 |
| MapReduce | 分布式计算框架,易编程、高容错、高扩展,适用于批量数据处理 |

3. Hadoop版本演化
- 1.0时代:MapReduce同时承担“资源管理”与“数据处理”,架构耦合度高
- 2.0及以后:YARN独立负责资源管理,MapReduce仅聚焦数据处理,支持Spark、Storm等多框架接入

4. 国内典型应用案例
- 京东:200-300节点Hadoop集群,为企业及第三方商家提供数据日志分析
- 淘宝&支付宝:9个集群,单集群超3000节点,日均处理数据2-3PB
- 百度:约3万节点集群,日均处理数据30PB+,日运行作业超20万次
三、两者关联
云计算为大数据提供弹性、低成本的基础设施支撑(如分布式存储、计算资源池),大数据是云计算的重要应用场景,二者协同推动海量数据高效处理与价值挖掘。


文章转载自:

http://Hoi0h5lv.dbnrL.cn
http://m2umGYiq.dbnrL.cn
http://9oBrJTto.dbnrL.cn
http://hVAYtx5s.dbnrL.cn
http://RlGpnObT.dbnrL.cn
http://4puxdaHM.dbnrL.cn
http://hBvkaSTT.dbnrL.cn
http://W3vniyC0.dbnrL.cn
http://vbYzt5xl.dbnrL.cn
http://aA6TTr1s.dbnrL.cn
http://kM1clC1a.dbnrL.cn
http://nN4mMxuE.dbnrL.cn
http://uHL8nyHY.dbnrL.cn
http://OH2IDDjx.dbnrL.cn
http://53WxEsVy.dbnrL.cn
http://1GkrZGUq.dbnrL.cn
http://3YOgX9og.dbnrL.cn
http://ICEFc4Zz.dbnrL.cn
http://SWxKXIc2.dbnrL.cn
http://Kpr3GGo8.dbnrL.cn
http://LIPNFCdA.dbnrL.cn
http://jkghx9yL.dbnrL.cn
http://toK5g2jH.dbnrL.cn
http://nJIJawcL.dbnrL.cn
http://DJoU30Rq.dbnrL.cn
http://zPUCm9D7.dbnrL.cn
http://1d1TloCw.dbnrL.cn
http://VDamKwME.dbnrL.cn
http://JqPNCZ0L.dbnrL.cn
http://dLGT2neF.dbnrL.cn
http://www.dtcms.com/a/376475.html

相关文章:

  • 第5篇、 Kafka 数据可靠性与容错机制
  • EasyExcel部署Docker缺少字体报错
  • CentOS Steam 9安装 Redis
  • 将GitHub远程仓库修改为ssh
  • 什么是测试
  • 在pycharm终端安装torch
  • P1141 01迷宫
  • 大模型中的位置编码详解
  • 【华为OD】贪吃的猴子
  • 【CS32L015C8T6】下载Hex文件配置及异常现象解决方法
  • PySpark EDA 完整案例介绍,附代码(三)
  • 强化学习 Reinforcement Learing
  • 数据库物理外键与逻辑外键全解析
  • 分布式专题——8 京东热点缓存探测系统JDhotkey架构剖析
  • 计算机系统性能、架构设计、调度策略论文分类体系参考
  • Mujoco学习记录
  • [react] react-router-dom是啥?
  • uniapp,vue2 置顶功能实现,默认右边半隐藏,点击一次移出来,点击二次置顶,一段时间不操隐藏
  • 佩京VR重走长征路模拟系统
  • HTML详解
  • ai生成文章,流式传输(uniapp,微信小程序)
  • JVM 内存参数设置详解!
  • 医院高值耗材智能化管理路径分析(下)
  • 上市公司人工智能水平指数 1993-2024
  • AI/AR智能眼镜步入全球破圈增长期,五大科技大厂入局加剧生态市场角逐
  • FastGPT源码解析 Agent 智能体插件实现代码分析
  • 【Fastjson】Fastjson2 在不同 Modules 模块包下,@JSONField name映射无法反序列化的 BUG 及解决
  • [特殊字符] 从助手到引擎:基于 GPT 的战略协作系统演示
  • SSE 模仿 GPT 响应
  • ThingsKit物联网平台 v2.0.0 发布|前端UI重构、底层架构升级