MySQL数据库故障排查指南
一、连接类问题
1. 无法连接数据库
-
现象:应用或客户端无法连接MySQL服务。
-
排查步骤:
-
检查服务状态:
bash
复制
下载
systemctl status mysqld # 检查MySQL是否运行 netstat -tuln | grep 3306 # 确认3306端口是否监听
-
检查网络问题:
-
防火墙是否放行3306端口:
bash
复制
下载
iptables -L -n | grep 3306
-
使用
telnet
或nc
测试网络连通性:bash
复制
下载
telnet <MySQL_IP> 3306
-
-
检查用户权限:
-
确认用户是否有远程访问权限:
sql
复制
下载
SELECT Host, User FROM mysql.user; GRANT ALL PRIVILEGES ON *.* TO 'user'@'%' IDENTIFIED BY 'password'; FLUSH PRIVILEGES;
-
-
检查配置文件:
-
查看
my.cnf
中是否绑定到127.0.0.1
:ini
复制
下载
bind-address = 0.0.0.0 # 允许所有IP连接
-
-
二、性能类问题
1. 查询缓慢
-
排查步骤:
-
开启慢查询日志:
sql
复制
下载
SET GLOBAL slow_query_log = 'ON'; SET GLOBAL long_query_time = 2; -- 定义慢查询阈值(秒)
-
分析慢查询:
-
查看慢查询日志文件路径:
sql
复制
下载
SHOW VARIABLES LIKE 'slow_query_log_file';
-
使用
mysqldumpslow
工具分析日志:bash
复制
下载
mysqldumpslow -s t /var/log/mysql/slow.log
-
-
使用
EXPLAIN
分析SQL执行计划:sql
复制
下载
EXPLAIN SELECT * FROM table WHERE condition;
-
检查索引缺失:
-
查看表索引状态:
sql
复制
下载
SHOW INDEX FROM table_name;
-
使用
OPTIMIZE TABLE
优化表:sql
复制
下载
OPTIMIZE TABLE table_name;
-
-
2. 锁竞争或死锁
-
排查步骤:
-
查看当前锁状态:
sql
复制
下载
SHOW ENGINE INNODB STATUS; -- 查看事务和锁信息 SHOW OPEN TABLES WHERE In_use > 0;
-
杀死阻塞进程:
sql
复制
下载
SHOW PROCESSLIST; -- 找到阻塞的进程ID KILL <process_id>;
-
设置锁超时(避免长事务):
sql
复制
下载
SET GLOBAL innodb_lock_wait_timeout = 30; -- 默认50秒
-
三、数据一致性问题
1. 表损坏或数据丢失
-
排查步骤:
-
检查表状态:
sql
复制
下载
CHECK TABLE table_name; -- 检查表是否损坏
-
修复表:
sql
复制
下载
REPAIR TABLE table_name; -- 仅对MyISAM表有效
-
使用
innodb_force_recovery
(InnoDB引擎):-
修改
my.cnf
并重启:ini
复制
下载
innodb_force_recovery = 1 -- 从1到6逐步尝试(6为最高修复级别)
-
-
2. 主从复制错误
-
排查步骤:
-
查看复制状态:
sql
复制
下载
SHOW SLAVE STATUS\G -- 关注Slave_IO_Running和Slave_SQL_Running
-
跳过指定错误(谨慎操作):
sql
复制
下载
STOP SLAVE; SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1; -- 跳过1个错误 START SLAVE;
-
重新同步数据:
-
使用
mysqldump
重新导出主库数据并导入从库。
-
-
四、日志与错误分析
1. 错误日志分析
-
查看错误日志路径:
sql
复制
下载
SHOW VARIABLES LIKE 'log_error';
-
常见错误码:
-
1045:权限错误 → 检查用户密码和主机白名单。
-
2003:连接超时 → 检查网络和防火墙。
-
1213:死锁 → 优化事务逻辑。
-
2. 二进制日志(Binlog)恢复
-
恢复误删数据:
bash
复制
下载
mysqlbinlog --start-datetime="2023-10-01 00:00:00" /var/log/mysql/binlog.000001 | mysql -u root -p
五、资源瓶颈排查
1. CPU/内存过高
-
排查步骤:
-
查看系统资源:
bash
复制
下载
top -c # 查看进程CPU/内存占用 vmstat 2 5 # 监控系统资源
-
优化MySQL配置:
-
调整
innodb_buffer_pool_size
(建议为物理内存的70%)。 -
减少并发连接数(
max_connections
)。
-
-
六、备份与恢复
1. 定期备份
-
物理备份:
bash
复制
下载
innobackupex --user=root --password=xxx /backup/
-
逻辑备份:
bash
复制
下载
mysqldump -u root -p --all-databases > backup.sql
2. 恢复数据
-
全量恢复:
bash
复制
下载
mysql -u root -p < backup.sql
七、高级故障排查工具
-
Percona Toolkit:分析慢查询、死锁和索引问题。
-
pt-query-digest:分析慢查询日志。
-
mytop:实时监控MySQL线程和查询。
八、预防措施
-
监控告警:使用Prometheus + Grafana监控MySQL状态。
-
定期优化:每周执行
OPTIMIZE TABLE
和ANALYZE TABLE
。 -
权限最小化:避免使用
root
账号运行应用。 -
测试备份恢复流程:确保备份文件可恢复。
通过以上步骤,可系统化定位并解决MySQL的常见故障。对于复杂问题,建议结合日志、监控工具和数据库快照进一步分析。