关系型数据库、非关系型数据库、结构化数据、半结构化数据、非结构化数据、OLAP、OLTP的关系和区分
关系
一句话:OLTP系统(如订单、支付)主要用关系型数据库处理结构化数据;OLAP系统(如报表、分析)常用非关系型数据库处理半结构化/非结构化数据。
数据形态
解决数据是什么的问题。以数据的存储格式和组织方式分为三类:
结构化数据:格式固定、遵循预定义schema,容易用关系模型表示,如数据库表、Excel表;
半结构化数据:无严格schema,有自描述性标签/格式,结构灵活,如JSON文件、XML文件;
非结构化数据:无固定格式,无法用传统行列或标签定义,多为二进制或长文本,如图片、视频;
数据库类型
解决数据怎么存的问题。分为关系型和非关系型:
关系型数据库(RDBMS):基于关系模型,数据以行列存储,表之间通过主键、外键建立关联。适用于事务场景。代表产品MySQL、Oracle、SQL Server;
非关系型数据库(NoSQL):不依赖传统关系模型,存储结构灵活,适配半结构化/非结构化数据。适用于处理海量数据、数据结构不定或高并发的场景,如朋友圈。代表产品:HBase、MongoDB、Neo4j;
数据处理类型
解决数据怎么用的问题。分别对应“分析”于“交易”场景:
OLTP(联机事务处理):支持高频、实时的事务操作,确保业务流程正常运转。依赖关系型数据库;
OLAP(联机分析处理):支持批量、多维度的分析操作,为决策提供数据支持,如分析用户消费偏好。基于数据仓库或支持OLAP的数据库(如ClickHouse)
