当前位置: 首页 > news >正文

MySQL基础全面解析

MySQL作为最流行的关系型数据库管理系统之一,是每一位开发者必备的核心技能。本文将系统性地解析MySQL的基础知识,结合关键概念与实战应用,帮助您构建扎实的数据库基础。

1. SQL与NoSQL的本质区别

SQL(结构化查询语言)数据库与NoSQL(非仅SQL)数据库代表了两种不同的数据管理哲学。

​SQL数据库​​(如MySQL、PostgreSQL):

  • 基于表格结构,数据以行和列的形式存储
  • 遵循预定义的模式(schema),结构严谨
  • 支持ACID事务(原子性、一致性、隔离性、持久性)
  • 使用SQL进行数据操作和查询
  • 适合复杂查询和高数据一致性的场景

​NoSQL数据库​​(如MongoDB、Redis):

  • 无固定模式,数据结构灵活
  • 可存储文档、键值对、宽列或图形数据
  • 通常遵循BASE原则(基本可用、软状态、最终一致性)
  • 横向扩展能力强,适合大规模数据存储
  • 适合非结构化数据和快速迭代的场景

选择依据:需要强一致性和复杂查询选SQL;需要灵活性和大规模扩展选NoSQL。

2. 数据库三大范式详解

数据库范式是设计关系型数据库的指导原则,旨在减少数据冗余和提高数据一致性。

​第一范式(1NF)​​:确保每列保持原子性,即每列都是不可再分的最小数据单元

-- 不符合1NF的设计(存储多个电话号码)
CREATE TABLE students (id INT PRIMARY KEY,name VARCHAR(50),phones VARCHAR(100) -- 存储"13800138000,13900139000"
);-- 符合1NF的设计
CREATE TABLE students (id INT PRIMARY KEY,name VARCHAR(50)
);CREATE TABLE student_phones (id INT PRIMARY KEY,student_id INT,phone VARCHAR(15),FOREIGN KEY (student_id) REFERENCES students(id)
);

​第二范式(2NF)​​:在满足1NF基础上,消除非主键列对主键的部分函数依赖

-- 不符合2NF的设计(订单详情表中产品价格依赖于产品ID而非订单ID)
CREATE TABLE order_details (order_id INT,product_id INT,product_price DECIMAL(10,2), -- 依赖于product_id而非主键quantity INT,PRIMARY KEY (order_id, product_id)
);-- 符合2NF的设计
CREATE TABLE order_details (order_id INT,product_id INT,quantity INT,PRIMARY KEY (order_id, product_id)
);CREATE TABLE products (product_id INT PRIMARY KEY,price DECIMAL(10,2)
);

​第三范式(3NF)​​:在满足2NF基础上,消除传递依赖,即非主键列之间不能有函数依赖

-- 不符合3NF的设计(学院电话依赖于学院,而学院依赖于学生ID)
CREATE TABLE students (student_id INT PRIMARY KEY,name VARCHAR(50),department VARCHAR(50),department_phone VARCHAR(15) -- 依赖于department,传递依赖于student_id
);-- 符合3NF的设计
CREATE TABLE students (student_id INT PRIMARY KEY,name VARCHAR(50),department_id INT,FOREIGN KEY (department_id) REFERENCES departments(department_id)
);CREATE TABLE departments (department_id INT PRIMARY KEY,name VARCHAR(50),phone VARCHAR(15)
);

实际应用中,有时为了性能会故意违反范式(反规范化),但需谨慎权衡。

3. MySQL连表查询深度解析

连表查询是SQL最强大的功能之一,允许从多个表中提取和组合数据。

3.1 INNER JOIN(内连接)

返回两个表中匹配条件的行

SELECT orders.order_id, customers.name, orders.order_date
FROM orders
INNER JOIN customers ON orders.customer_id = customers.customer_id;

3.2 LEFT JOIN(左连接)

返回左表所有行,即使右表中没有匹配

SELECT customers.name, orders.order_id
FROM customers
LEFT JOIN orders ON customers.customer_id = orders.customer_id
WHERE orders.order_id IS NULL; -- 查找从未下过单的客户

3.3 RIGHT JOIN(右连接)

返回右表所有行,即使左表中没有匹配

SELECT products.name, order_details.quantity
FROM order_details
RIGHT JOIN products ON order_details.product_id = products.product_id;

3.4 FULL OUTER JOIN(全外连接)

MySQL不直接支持FULL OUTER JOIN,但可通过UNION实现

SELECT customers.name, orders.order_id
FROM customers
LEFT JOIN orders ON customers.customer_id = orders.customer_id
UNION
SELECT customers.name, orders.order_id
FROM customers
RIGHT JOIN orders ON customers.customer_id = orders.customer_id;

3.5 CROSS JOIN(交叉连接)

返回两个表的笛卡尔积

SELECT sizes.size, colors.color
FROM sizes
CROSS JOIN colors;

4. 避免重复插入数据的多种策略

4.1 使用PRIMARY KEY或UNIQUE约束

CREATE TABLE users (email VARCHAR(100) PRIMARY KEY, -- 主键自动具有唯一性name VARCHAR(50) NOT NULL
);-- 或者使用UNIQUE约束
CREATE TABLE users (id INT AUTO_INCREMENT PRIMARY KEY,email VARCHAR(100) UNIQUE, -- 添加唯一约束name VARCHAR(50) NOT NULL
);

4.2 INSERT IGNORE

忽略重复键错误,但会忽略所有错误,需谨慎使用

INSERT IGNORE INTO users (email, name) VALUES ('test@example.com', 'Test User');

4.3 ON DUPLICATE KEY UPDATE

遇到重复时执行更新操作

INSERT INTO users (email, name) 
VALUES ('test@example.com', 'Test User')
ON DUPLICATE KEY UPDATE name = VALUES(name);

4.4 REPLACE INTO

先删除重复行再插入新行(注意:这会删除整行而不仅仅是更新指定字段)

REPLACE INTO users (email, name) VALUES ('test@example.com', 'New Test User');

5. 数据类型深度解析

5.1 CHAR与VARCHAR的区别

  • ​CHAR​​:固定长度字符串,长度范围为0-255字符

    • 适合存储长度相对固定的数据(如MD5哈希、国家代码)
    • 存储时总会占用指定长度的空间,短字符串会用空格填充
    • 检索速度通常比VARCHAR快
  • ​VARCHAR​​:可变长度字符串,长度范围为0-65,535字符

    • 适合存储长度变化较大的数据
    • 仅占用实际数据长度+1或+2字节(长度前缀)的空间
    • 更新可能引起页分裂,影响性能

选择建议:长度基本固定的字段用CHAR,变化较大的用VARCHAR。

5.2 VARCHAR后面的数字代表什么?

VARCHAR(50)中的50表示​​最大字符数​​,而非字节数。在utf8mb4字符集下:

  • 每个字符最多占用4字节
  • 实际存储空间 = 字符数 × 每个字符的字节数 + 长度前缀(1-2字节)

5.3 INT(1)和INT(10)的区别

括号中的数字是​​显示宽度​​,仅影响某些客户端显示格式,不影响存储大小或范围。

  • 所有INT类型都占用4字节存储空间
  • 范围都是-2147483648到2147483647(有符号)或0到4294967295(无符号)
  • 使用ZEROFILL时,显示宽度才有实际意义
CREATE TABLE test_int (num1 INT(1) ZEROFILL, -- 显示为0001num2 INT(10) ZEROFILL -- 显示为0000000001
);

5.4 TEXT数据类型的容量限制

TEXT类型不能"无限大",但有多种变体满足不同需求:

  • TINYTEXT: 最大255字节(约255个字符)
  • TEXT: 最大65,535字节(约64KB)
  • MEDIUMTEXT: 最大16,777,215字节(约16MB)
  • LONGTEXT: 最大4,294,967,295字节(约4GB)

5.5 IP地址的存储最佳实践

​推荐方案​​:使用INT UNSIGNED存储IPv4地址

-- 存储时转换
INSERT INTO logs (ip_address) VALUES (INET_ATON('192.168.1.1'));-- 查询时转换回可读格式
SELECT id, INET_NTOA(ip_address) as ip FROM logs;-- 对于IPv6,使用VARBINARY(16)
ALTER TABLE logs ADD ipv6_address VARBINARY(16);

6. 外键约束全面解析

外键用于维护表间引用完整性,确保数据一致性。

6.1 创建外键约束

CREATE TABLE orders (order_id INT PRIMARY KEY,customer_id INT,order_date DATE,FOREIGN KEY (customer_id) REFERENCES customers(customer_id)ON DELETE CASCADEON UPDATE CASCADE
);

6.2 外键操作选项

  • ​RESTRICT​​(默认):阻止删除或更新被引用的行
  • ​CASCADE​​:级联操作,主表删除/更新时,从表相关行也删除/更新
  • ​SET NULL​​:主表删除/更新时,从表外键字段设为NULL
  • ​NO ACTION​​:与RESTRICT类似,但检查时机略有不同

6.3 外键的优缺点

​优点​​:

  • 保证数据完整性和一致性
  • 防止误删重要数据
  • 明确表间关系,提高可读性

​缺点​​:

  • 增加性能开销(每次修改都需要检查外键约束)
  • 可能导致死锁问题
  • 使分库分表更复杂

7. IN与EXISTS关键字的深度对比

7.1 IN运算符

SELECT * FROM employees 
WHERE department_id IN (SELECT department_id FROM departments WHERE location = 'NY');
  • 先执行子查询,将结果集物化
  • 然后执行主查询,检查值是否在物化结果集中
  • 适合子查询结果集较小的情况

7.2 EXISTS运算符

SELECT * FROM employees e
WHERE EXISTS (SELECT 1 FROM departments d WHERE d.department_id = e.department_id AND d.location = 'NY'
);
  • 对外部查询的每一行执行子查询
  • 子查询使用关联条件,通常可利用索引
  • 适合外部查询结果集较小或子查询能够有效利用索引的情况

7.3 性能对比建议

  • 当子查询结果集小且外部查询大时,使用IN
  • 当外部查询结果集小且子查询可有效利用索引时,使用EXISTS
  • 在可能的情况下,尽量使用JOIN代替IN或EXISTS

8. MySQL常用函数大全

8.1 字符串函数

-- 连接字符串
SELECT CONCAT(first_name, ' ', last_name) AS full_name FROM employees;-- 字符串截取
SELECT SUBSTRING('MySQL', 3, 3); -- 结果: 'SQL'-- 字符串替换
SELECT REPLACE('Hello World', 'World', 'MySQL'); -- 结果: 'Hello MySQL'-- 大小写转换
SELECT LOWER('MySQL'), UPPER('mysql');-- 去除空格
SELECT TRIM('  MySQL  '), LTRIM('  MySQL'), RTRIM('MySQL  ');

8.2 数值函数

-- 四舍五入
SELECT ROUND(123.4567, 2); -- 结果: 123.46-- 向上取整/向下取整
SELECT CEIL(123.4), FLOOR(123.8); -- 结果: 124, 123-- 绝对值
SELECT ABS(-123); -- 结果: 123-- 随机数
SELECT RAND(); -- 生成0-1之间的随机浮点数

8.3 日期时间函数

-- 当前日期时间
SELECT NOW(), CURDATE(), CURTIME();-- 日期加减
SELECT DATE_ADD(NOW(), INTERVAL 7 DAY); -- 7天后
SELECT DATE_SUB(NOW(), INTERVAL 1 MONTH); -- 1个月前-- 日期格式化
SELECT DATE_FORMAT(NOW(), '%Y-%m-%d %H:%i:%s'); -- 2023-01-01 12:34:56-- 日期提取
SELECT YEAR(NOW()), MONTH(NOW()), DAY(NOW());

8.4 聚合函数

SELECT COUNT(*) AS total_rows,AVG(salary) AS average_salary,MAX(salary) AS max_salary,MIN(salary) AS min_salary,SUM(salary) AS total_salary
FROM employees;

9. SQL查询语句执行顺序详解

理解SQL执行顺序是编写高效查询的关键:

  1. ​FROM​​ 和 JOIN:确定数据来源,执行表连接
  2. ​WHERE​​:过滤不符合条件的行
  3. ​GROUP BY​​:按指定列分组
  4. ​HAVING​​:过滤分组后的结果
  5. ​SELECT​​:选择要返回的列
  6. ​DISTINCT​​:去除重复行
  7. ​ORDER BY​​:排序结果集
  8. ​LIMIT​​/OFFSET:限制返回行数
-- 示例查询及其执行顺序
SELECT DISTINCT department, AVG(salary) as avg_salary
FROM employees
WHERE hire_date > '2020-01-01'
GROUP BY department
HAVING AVG(salary) > 50000
ORDER BY avg_salary DESC
LIMIT 10;

10. 实战SQL题目解析

10.1 题目一:不存在01课程但存在02课程的学生的成绩

SELECT sc.stuid, sc.subject_id, sc.score
FROM studentscore sc
WHERE sc.stuid IN (SELECT stuid FROM studentscore WHERE subject_id = '02'
) AND sc.stuid NOT IN (SELECT stuid FROM studentscore WHERE subject_id = '01'
);

10.2 题目二:查询总分排名5-10名的学生

SELECT stuid, SUM(score) as total_score
FROM studentscore
GROUP BY stuid
ORDER BY total_score DESC
LIMIT 4, 6; -- 从第5名开始,取6条记录(5-10名)

10.3 题目三:查询班级选课情况

SELECT s.student_id, s.name, GROUP_CONCAT(DISTINCT c.course_name ORDER BY c.course_name SEPARATOR ', ') as courses
FROM students s
LEFT JOIN student_courses sc ON s.student_id = sc.student_id
LEFT JOIN courses c ON sc.course_id = c.course_id
WHERE s.class_id = '特定班级ID'
GROUP BY s.student_id, s.name;

11. 用MySQL实现可重入锁

11.1 创建锁表

CREATE TABLE system_locks (lock_name VARCHAR(100) PRIMARY KEY,lock_owner VARCHAR(100) NOT NULL,lock_count INT DEFAULT 0,acquired_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
) ENGINE=InnoDB;

11.2 获取锁存储过程

DELIMITER $$CREATE PROCEDURE acquire_lock(IN p_lock_name VARCHAR(100),IN p_owner VARCHAR(100),IN p_timeout INT
)
BEGINDECLARE v_start_time INT DEFAULT UNIX_TIMESTAMP();DECLARE v_acquired BOOLEAN DEFAULT FALSE;DECLARE v_lock_count INT;WHILE NOT v_acquired AND UNIX_TIMESTAMP() - v_start_time < p_timeout DO-- 检查锁是否已被当前所有者持有SELECT lock_count INTO v_lock_count FROM system_locks WHERE lock_name = p_lock_name AND lock_owner = p_owner;IF v_lock_count IS NOT NULL THEN-- 重入锁:增加计数UPDATE system_locks SET lock_count = lock_count + 1, updated_at = CURRENT_TIMESTAMPWHERE lock_name = p_lock_name AND lock_owner = p_owner;SET v_acquired = TRUE;ELSE-- 尝试获取新锁BEGININSERT INTO system_locks (lock_name, lock_owner, lock_count)VALUES (p_lock_name, p_owner, 1);SET v_acquired = TRUE;EXCEPTIONWHEN 1062 THEN -- 唯一键冲突,锁已被其他进程持有DO SLEEP(0.1); -- 短暂等待后重试END;END IF;END WHILE;SELECT v_acquired as lock_acquired;
END
$$DELIMITER ;

11.3 释放锁存储过程

DELIMITER $$CREATE PROCEDURE release_lock(IN p_lock_name VARCHAR(100),IN p_owner VARCHAR(100)
)
BEGINDECLARE v_lock_count INT;START TRANSACTION;SELECT lock_count INTO v_lock_count FROM system_locks WHERE lock_name = p_lock_name AND lock_owner = p_ownerFOR UPDATE;IF v_lock_count IS NOT NULL THENIF v_lock_count > 1 THEN-- 减少重入计数UPDATE system_locks SET lock_count = lock_count - 1, updated_at = CURRENT_TIMESTAMPWHERE lock_name = p_lock_name AND lock_owner = p_owner;ELSE-- 完全释放锁DELETE FROM system_locks WHERE lock_name = p_lock_name AND lock_owner = p_owner;END IF;END IF;COMMIT;
END
$$DELIMITER ;

11.4 使用示例

-- 获取锁
CALL acquire_lock('order_processing', 'service_1', 10);-- 执行需要加锁的操作...-- 释放锁
CALL release_lock('order_processing', 'service_1');

总结

MySQL基础知识涵盖了从数据类型选择到复杂查询优化的各个方面。掌握这些核心概念对于构建高效、可靠的数据库应用至关重要。在实际开发中,应该:

  1. 根据业务需求合理选择数据类型和表结构设计
  2. 理解SQL执行顺序,编写高效的查询语句
  3. 合理使用索引和约束保证数据完整性和查询性能
  4. 在复杂场景下考虑使用事务和锁机制保证数据一致性

持续学习和实践是掌握MySQL的关键,建议通过实际项目不断深化对这些概念的理解和应用。


文章转载自:

http://n3No5m0W.skbhL.cn
http://jJUbcT8o.skbhL.cn
http://DIi8YPZH.skbhL.cn
http://ycYyzwIT.skbhL.cn
http://91M15uPU.skbhL.cn
http://qWoDz03Q.skbhL.cn
http://wuU8vCqD.skbhL.cn
http://tXoRswFJ.skbhL.cn
http://suD5U13o.skbhL.cn
http://kwGzZN6A.skbhL.cn
http://6Z3nPt61.skbhL.cn
http://DJG5TRQf.skbhL.cn
http://QEyVXPb0.skbhL.cn
http://xUwB3adp.skbhL.cn
http://g600gCSx.skbhL.cn
http://76VgSbv0.skbhL.cn
http://O82p9Oxv.skbhL.cn
http://d0PgbdFF.skbhL.cn
http://1Bz68P9t.skbhL.cn
http://Y4hk81mu.skbhL.cn
http://lzwUjyTN.skbhL.cn
http://gD95uxf9.skbhL.cn
http://ovsSVJmk.skbhL.cn
http://ycd4bA8y.skbhL.cn
http://uoLNCpqW.skbhL.cn
http://T8WSg0Ro.skbhL.cn
http://01s0jhDI.skbhL.cn
http://RSKvvLU3.skbhL.cn
http://i2lNTpDv.skbhL.cn
http://KpR58Eqo.skbhL.cn
http://www.dtcms.com/a/379181.html

相关文章:

  • 探索容器技术:从LXC到Podman的演进
  • IntelliJ IDEA 启动项目时配置端口指南
  • java 实现rtsp 直播流下载
  • Python高级编程实战:装饰器、迭代器与生成器的深度应用
  • 高级SQL技术综合指南(MySQL)
  • 【51单片机】【protues仿真】基于51单片机电子琴系统
  • 解决idea2021maven依赖导入后还是找不到包,爆红无法导入
  • Netty学习
  • VGGNet:为什么16层简单堆叠能成为CNN经典?
  • 知识图谱RAG
  • 与controller层的接口入参注解@Valid有关的实体类判断空的注解
  • 基于AT89C52单片机的智能蓝牙台灯设计
  • Javaweb前端内容的思维导图
  • PyTorch深度学习实战【10】之神经网络的损失函数
  • 3.前置知识学习
  • Whois查询域名信息
  • 机器学习vs人类学习:人类学习如何借鉴机器学习方法?
  • ES6 面试题及详细答案 80题 (41-54)-- 异步编程(Promise/Generator/async)
  • Bug记录:Lombok @Builder 注解的两大陷阱及解决方案
  • ARM汇编 beep及bsp工程管理
  • 深入理解 Vue3 Router:三种路由模式的工作原理与实战应用
  • 2025 ICPC Gran Premio de Mexico 3ra Fecha
  • ZLMediaKit性能测试
  • 使用PyQt5和NumPy从TXT文件读取平面点集数据
  • nacos1.3.2 ARM 版容器镜像制作
  • LINUX中Docker Swarm的介绍和使用
  • 探索大语言模型(LLM):Ollama快速安装部署及使用(含Linux环境下离线安装)
  • 安卓13_ROM修改定制化-----打开摄像头调用相机功能 实现无人直播
  • 嵌入式 - ARM5
  • 如何打造自主安全的下一代域名系统