当前位置：首页 > news >正文

【MySQL】数据库基本知识

news 2025/11/10 11:06:52

一、为什么要有数据库？

二、常见主流数据库

1.关系型数据库（SQL）

2.非关系型数据库（NoSQL）

三、MySQL基础

1.连接服务器

2. 服务器，数据库，表关系

3. 基本使用

4. 操作示例

5. MySQL架构

6. SQL分类

7. 存储引擎

一、为什么要有数据库？

为什么不用文件存储数据算了，还弄个数据库呢？

文件保存数据有以下缺点：

文件的安全性问题
文件不利于数据查询和管理
文件不利于存储海量数据
文件在程序中控制不方便

针对上述问题，数据库诞生了，它能更有效的进行数据管理，数据库的知识水平也成了程序员的重要素质之一。

二、常见主流数据库

1.关系型数据库（SQL）

关系型数据库基于表格模型，支持 SQL 查询，适合结构化数据存储，强调数据一致性。

MySQL：开源免费的轻量型关系型数据库，兼容性强、部署维护简单。核心用于中小型应用、互联网项目，是 Web 开发的首选数据库之一。
PostgreSQL：功能全面的开源关系型数据库，支持复杂查询、JSON 数据类型和自定义扩展。稳定性和扩展性突出，适合企业级应用、数据仓库和科研场景。
Oracle：商业闭源的企业级关系型数据库，性能强劲、安全性高，支持大规模数据处理和高并发。常用于金融、政府、电信等核心业务系统，收费较高。
SQL Server：微软推出的商业关系型数据库，易用性强、与 Windows 生态深度兼容。适合.NET 技术栈的企业应用，在中小型企业中应用广泛。

2.非关系型数据库（NoSQL）

非关系型数据库不依赖表格模型，灵活易扩展，适合非结构化 / 半结构化数据，侧重高并发和海量数据存储。

MongoDB：文档型 NoSQL 数据库，以 JSON 格式存储数据，无需预设 schema。灵活度高、扩展便捷，适合电商商品管理、内容平台、物联网等场景。
Redis：内存型 NoSQL 数据库，读写速度极快，支持字符串、哈希、列表等多种数据结构。核心用作缓存、会话存储、消息队列，提升应用响应速度。
Cassandra：分布式列存储 NoSQL 数据库，高可用、高扩展，支持跨区域部署。适合海量数据存储（如日志、用户行为数据），能应对高并发写入场景。
Elasticsearch：搜索引擎型 NoSQL 数据库，基于 Lucene 构建，擅长全文检索和数据分析。常用于日志分析、商品搜索、舆情监控等需要快速查询的场景。

三、MySQL基础

MySQL是以，以下皆为Linux系统下的MySQL相关操作，安装方式网上已有很多教程，这里不再赘述。

1.连接服务器

mysql -h 127.0.0.1 -P 3306 -u root -p

2. 服务器，数据库，表关系

所谓安装数据库服务器，只是在机器上安装了一个数据库管理系统程序，这个管理程序可以管理多
个数据库，一般开发人员会针对每一个应用创建一个数据库。
为保存应用中实体的数据，一般会在数据库中创建多个表，以保存程序中实体的数据。

数据库服务器、数据库和表的关系如下：

注：DB即database（数据库）

可以看到MySQL服务器中维护着各种数据库，数据库中维护着各种表，而客户端访问服务器对数据进行操作。

3. 基本使用

创建数据库

create database hellomysql;

使用数据库

use hellomysql;

创建数据库表

create table student(id int,name varchar(32),gender varchar(2)
);

表中插入数据

insert into student (id, name, gender) values (1, '张三', '男');
insert into student (id, name, gender) values (2, '李四', '女');
insert into student (id, name, gender) values (3, '王五', '男');

查询表中的数据

select * from student;

4. 操作示例

如果使用非root用户创建database失败，可以登录root用户后使用以下命令为用户赋予权限：

GRANT CREATE ON *.* TO 'username'@'host';

也可以暂时使用root用户进行学习，后续我会讲解用户管理相关内容。

5. MySQL架构

MySQL 是一个可移植的数据库，几乎能在当前所有的操作系统上运行，如 Unix/Linux 、 Windows 、 Mac 和 Solaris 。各种系统在底层实现方面各有不同，但是 MySQL 基本上能保证在各个平台上的物理体系结构的一致性。

6. SQL分类

DDL【data definition language】数据定义语言，用来维护存储数据的结构

代表指令: create, drop, alter

DML【data manipulation language】数据操纵语言，用来对数据进行操作

代表指令： insert ， delete ， update

DML中又单独分了一个 DQL ，数据查询语言，代表指令： select

DCL【Data Control Language】数据控制语言，主要负责权限管理和事务

代表指令： grant ， revoke ， commit

7. 存储引擎

存储引擎是：数据库管理系统如何存储数据、如何为存储的数据建立索引和如何更新、查询数据等技术的实现方法。
MySQL的核心就是插件式存储引擎，支持多种存储引擎。

可以通过该命令查看存储引擎：

show engines;

以下是 MySQL 主流存储引擎的核心特性对比表（基于 MySQL 8.0 及 2025 年最新实践）：

特性	InnoDB（默认）	MyISAM	Memory	Archive	NDB Cluster	ColumnStore	RocksDB
事务支持	✅ ACID 兼容 + 分布式事务（X/Open XA）	❌ 非事务型	❌ 无事务支持	❌ 非事务型	✅ 分布式事务（弱一致性）dev.mysql.com	❌ 非事务型	❌ 仅支持单行事务
锁粒度	✅ 行级锁 + MVCC（高并发）	❌ 表级锁（读多写少场景）	❌ 表级锁（内存操作）	✅ 行级锁（仅插入时）	✅ 行级锁（自动分片）dev.mysql.com	❌ 表级锁（批量操作）	✅ 行级锁（基于 LSM-Tree）
索引类型	聚簇 B + 树索引（主键索引存储数据） + 全文索引（MySQL 5.6+） + 空间索引	非聚簇 B + 树索引 + 全文索引（原生支持）	Hash/BTree（等值查询快，范围查询慢）	❌ 不支持索引（全表扫描）	哈希索引 + BTree（分布式索引）dev.mysql.com	列存储索引（OLAP 优化）	LSM-Tree（写入优化，随机读弱）
数据持久化	✅ 磁盘存储 + 事务日志（Redo/Undo）	✅ 磁盘存储（.frm/.MYD/.MYI）	❌ 内存存储（重启丢失） + 可选持久化内存（PMEM 技术）	✅ 磁盘存储（压缩格式.arz）	✅ 分布式磁盘存储（多副本）dev.mysql.com	✅ 磁盘存储（列式压缩）	✅ 磁盘存储（LSM-Tree 结构）
存储容量	64TB（单表）	256TB（云存储扩展）	2TB（内存限制）	理论无上限（压缩比 10-15:1）	64TB（集群）dev.mysql.com	1PB（列式存储压缩）	无明确上限（依赖磁盘）
适用场景	通用场景（金融、电商、订单），高并发读写 + 事务强一致性	读多写少（日志分析、报表） + 全文检索	临时数据、缓存（如购物车、实时统计） + 内存充足场景	历史数据归档（日志、监控数据） + 写入密集	分布式高可用（金融交易、电信） + 自动故障转移dev.mysql.com	数据仓库、实时分析（OLAP） + 列查询优化	写入密集型（物联网、时序数据） + 高吞吐量
典型性能	随机写：3 万 TPS，顺序读：50 万 QPS	随机读：5 万 TPS，插入：1 万 TPS	内存操作：微秒级响应	插入：10 万 TPS，查询：全表扫描慢	分布式读：20 万 QPS，写：15 万 TPSdev.mysql.com	列查询：比 InnoDB 快 10 倍	写入：20 万 QPS，随机读：1 万 QPS
其他特性	外键约束 + 自适应哈希索引 + 压缩表（InnoDB 8.1+）	压缩表（只读） + 快速表修复	固定长度行存储 + 内存碎片优化	数据压缩（zlib） + 仅支持 INSERT/SELECT	自动分片 + 多活架构 + 跨云部署	实时聚合（SUM/COUNT） + 冷热数据分离	冷热数据分层 + 低延迟写入