当前位置: 首页 > news >正文

HBase新手入门

15分钟学完HBase原理与架构分析_哔哩哔哩_bilibili

HBase是大数据存储组件,全名Hadoop Database

特性:

  • 高可靠:安全、稳定
  • 高性能:存储亿级数据,毫秒查询
  • 面向列:按“列”存储
  • 可伸缩:方便添加删除节点

专有名词对比

列族包括多个列 

  • 时间戳(TimeStamp):默认,与列值一一对应
    • 版本:越新插入的数据,版本越高,优先展示
  • 数据类型(DataType):Byte[]         HBase中数据类型只有这一种
  • 区域(Region):按行划分,自动分裂

逻辑存储模型:

架构分析 

  • 主从架构
  • Master主节点(HMaster进程):管理HBase中Table和Region
  • RegionServer从节点(HRegionServer进程):处理数据读写和持久化
  • Zookeeper集群:协调服务,管理Master和RegionServer状态
  • HDFS(Hadoop Distributed File System):底层存储分布式文件系统,负责将大文件分割成小块(通常 128MB 或 256MB),并存储在集群中的多个节点上,实现数据的冗余备份(默认 3 份副本),保证数据安全性和高可用性。

应用场景

  1. 数据量大
  2. 多版本数据
  3. 稀疏性数据
  4. 非结构化或半结构化数据 
http://www.dtcms.com/a/294484.html

相关文章:

  • kafka动态配置详解
  • Tile级原语与自动推理机制融合,TileAI社区发起人深度剖析TileLang核心技术与优势
  • 小白做投资测算,如何快速上手?
  • Hot100题解
  • iOS 抓包工具有哪些?2025实用指南与场景推荐
  • Docker 基础概念
  • 开源的语音合成大模型-Cosyvoice使用介绍
  • UE5多人MOBA+GAS 29、创建一个等级UI
  • Effective Python 第15条 不要过分依赖给字典添加条目时所用的顺序
  • Kafka的介绍
  • Linux 或者 Ubuntu 离线安装 ollama
  • windows 11 下git软件提交正常,idea git提交总提示需要token
  • Java设计模式-备忘录模式
  • 前缀和经典问题整理
  • 扫描电镜与透射电镜联用表征形貌与元素组成-测试GO
  • C语言(20250723)
  • Zookeeper基本功能和应用场景
  • Zookeeper学习专栏(八):使用高级客户端库Apache Curator
  • 【数据结构初阶】--树和二叉树先导篇
  • spring的value注解
  • 使用Qt下QAudioOutput播放声音
  • Google DeepMind发布MoR架构:50%参数超越传统Transformer,推理速度提升2倍
  • 网络安全威胁和防御措施
  • 水库大坝安全自动监测系统:守护水脉长城的智能防线
  • DDD领域驱动设计C++实现案例:订单管理系统
  • mysql 远程连接配置
  • 比特币技术简史 第六章:网络协议 - P2P网络、节点类型与消息传播
  • SCDN:网络安全新防线下的技术革新与安全效能
  • SQL数据清洗实用函数——以具体场景为例详细学习
  • (一)从零搭建unity3d机械臂仿真-unity3d导入urdf模型