当前位置：首页 > news >正文

MyCat 实战：订单与用户数据的水平分库分表 + MySQL 读写分离完整方案

news 2025/10/14 11:23:26

在电商、社交等业务场景中，随着用户量与订单量的增长，单表数据量极易突破千万级，导致查询缓慢、写入延迟（如订单表单表 1 亿条数据时，分页查询需数秒）；同时，读写请求集中在同一数据库，易造成 CPU、IO 资源耗尽。MyCat 作为开源的分布式数据库中间件，可通过 “水平分库分表” 拆分海量数据，结合 MySQL 主从复制实现 “写主库、读从库” 的读写分离，从根本上解决单库单表的性能瓶颈。本文以 “订单 + 用户” 核心业务为例，带你掌握从方案设计到落地的全流程。

一、为什么需要 MyCat+MySQL 主从？—— 海量数据与高并发的痛点

在深入技术细节前，先明确传统单库单表与单节点数据库的核心痛点，理解 MyCat 分库分表与 MySQL 读写分离的价值。

1.1、单库单表的性能瓶颈（分库分表的必要性）

1.1.1、数据量过大导致查询缓慢

索引失效风险：单表数据量超过 1000 万条时，即使有索引，查询也需扫描大量数据页（如订单表按用户 ID 查询，索引树深度增加，IO 次数增多）；

DDL 操作阻塞：对大表执行 ALTER TABLE（如添加字段）时，会锁表且执行时间长达数小时，影响业务可用性；

存储瓶颈：单表数据文件过大（如 1 亿条订单数据占 100GB），备份、恢复时间长，且易触发磁盘空间不足。

1.1.2、 “订单 + 用户” 业务的分表需求

以电商业务为例，核心数据特征决定需水平拆分：

用户表：用户 ID 唯一，数据量随用户增长（如 1 亿用户），适合按用户 ID 哈希拆分，确保每个分表数据均匀；

订单表：与用户强关联，且按时间递增（新订单不断产生），适合按 “用户 ID 哈希 + 时间范围” 双维度拆分，既保证查询用户订单时仅访问对应分表，又避免单分表数据随时间堆积。

1.2、单节点数据库的读写压力（读写分离的必要性）

读多写少场景：电商业务中，读请求（如用户查询订单列表、商品详情）是写请求（如创建订单、支付）的 5~10 倍，单节点数据库易因读请求过多导致 CPU 利用率达 100%；

数据安全性：主从复制可实现数据备份，主库故障时从库可快速切换，避免数据丢失；

业务隔离：可将不同类型的读请求分配到不同从库（如报表查询从库、APP 查询从库），避免报表统计等重查询影响核心业务。

1.3、 MyCat 的核心价值：一站式解决分库分表与读写分离

MyCat 作为中间件，无需修改业务代码即可实现：

透明分库分表：业务端通过 MyCat 访问数据，无需感知数据拆分规则（如用户 ID=1001 的订单存储在哪个分表）；

读写分离路由：自动将写请求（INSERT/UPDATE/DELETE）路由到主库，读请求（SELECT）路由到从库；

故障切换：支持 MySQL 主从故障自动切换，从库不可用时自动路由到其他从库或主库；

兼容性强：完全兼容 MySQL 协议，业务端可使用 MySQL 客户端、JDBC 等工具直接连接 MyCat，无需适配新接口。

二、核心原理：水平分库分表与 MySQL 主从复制

掌握 MyCat 水平分表规则与 MySQL 主从复制机制，是方案设计的基础。

2.1、水平分库分表：按数据特征拆分数据

分库分表分为 “水平拆分” 与 “垂直拆分”，本文聚焦 “水平拆分”（将同一表的数据按规则分散到多个库 / 表，表结构相同），核心规则如下：

2.1.1、拆分维度选择（以订单 + 用户为例）

业务表	拆分维度	拆分规则	优势
用户表	用户 ID（哈希拆分）	用户 ID % 分表数 = 分表索引（如分 4 表，ID=1001→1001%4=1→用户表 1）	数据均匀分布，查询用户信息时仅访问 1 个分表
订单表	用户 ID（哈希）+ 时间范围	先按用户 ID 哈希定位分库 / 分表，再按订单创建时间（如年月）拆分（如 2024 年订单存订单表_2024）	兼顾 “按用户查询” 与 “按时间归档”，避免单分表数据随时间堆积

2.1.2、拆分粒度：分库 vs 分表

仅分表：所有分表存储在同一数据库，适合单库性能可支撑的场景（如分 16 表，单库可承载）；

分库分表：分表分散在多个数据库（如 4 个库，每个库 4 个分表），适合单库资源（CPU、IO）不足的场景，本文采用 “分库分表” 方案（4 库 8 表：user_db0~user_db3 共 4 个用户库，order_db0~order_db3 共 4 个订单库，每个库 2 个分表）。

2.2、 MySQL 主从复制：实现数据同步与读写分离

MySQL 主从复制基于 “二进制日志（binlog）” 实现，核心流程如下：

主库（Master）：将写操作记录到 binlog（如 INSERT 订单数据）；
从库（Slave）：启动 IO 线程，读取主库 binlog 并写入本地 “中继日志（relay log）”；
从库（Slave）：启动 SQL 线程，解析中继日志并执行，实现与主库数据同步；
读写分离：MyCat 拦截 SQL，写请求发往主库，读请求发往从库，确保主从数据一致性（需设置合理的同步延迟阈值）。

2.2.1、主从复制模式选择

异步复制（默认）：主库写入 binlog 后立即返回，不等待从库同步，性能高但可能存在数据不一致（主库宕机时未同步的 binlog 丢失）；

半同步复制：主库需等待至少 1 个从库确认接收 binlog 后才返回，兼顾性能与数据一致性，本文采用半同步复制。

三、环境准备：搭建 MySQL 主从集群与 MyCat

3.1、步骤 1：部署 MySQL 主从集群（1 主 2 从）

3.1.1、服务器规划（基于 CentOS 7）

角色	IP 地址	端口	用途
MySQL 主库	192.168.1.10	3306	处理写请求（用户注册、创建订单）
MySQL 从库 1	192.168.1.11	3306	处理读请求（查询用户信息、订单列表）
MySQL 从库 2	192.168.1.12	3306	读请求备份，主从故障切换备用

3.1.2、配置主库（Master）

1、修改 my.cnf 配置文件：

[mysqld]
server-id=10 # 唯一ID（主从不能重复）
log-bin=mysql-bin # 开启binlog，日志文件名前缀
binlog-format=ROW # binlog格式（ROW模式：记录行级变更，支持数据一致性）
binlog-do-db=user_db0 # 需同步的用户库（多个库需重复配置）
binlog-do-db=user_db1
binlog-do-db=order_db0
binlog-do-db=order_db1
binlog-ignore-db=mysql # 忽略同步的库
plugin-load-add=rpl_semi_sync_master.so # 加载半同步复制插件
loose-rpl_semi_sync_master_enabled=1 # 开启半同步复制
loose-rpl_semi_sync_master_timeout=1000 # 超时时间（1秒，超时后降级为异步）

2、重启 MySQL 并创建同步账号：

# 重启MySQL
systemctl restart mysqld
# 登录MySQL，创建从库同步账号（允许从库IP访问）
CREATE USER 'repl'@'192.168.1.%' IDENTIFIED BY 'Repl@123456';
# 授予复制权限
GRANT REPLICATION SLAVE ON *.* TO 'repl'@'192.168.1.%';
FLUSH PRIVILEGES;
# 查看主库binlog状态（记录File与Position，从库配置需用）
SHOW MASTER STATUS;
# 输出示例：File=mysql-bin.000001，Position=156

3.1.3、配置从库（Slave1：192.168.1.11）

1、修改 my.cnf 配置文件：

[mysqld]
server-id=11 # 唯一ID（与主库不同）
relay-log=mysql-relay # 开启中继日志
read-only=1 # 从库设置为只读（仅对普通用户生效，root仍可写）
super-read-only=1 # MySQL 8.0+，禁止root写操作
replicate-do-db=user_db0 # 需同步的库（与主库一致）
replicate-do-db=user_db1
replicate-do-db=order_db0
replicate-do-db=order_db1
plugin-load-add=rpl_semi_sync_slave.so # 加载半同步复制插件
loose-rpl_semi_sync_slave_enabled=1 # 开启半同步复制

2、重启 MySQL 并配置主从同步：

# 重启MySQL
systemctl restart mysqld
# 登录MySQL，配置主库信息（File与Position为主库SHOW MASTER STATUS结果）
CHANGE MASTER TO
MASTER_HOST='192.168.1.10',
MASTER_USER='repl',
MASTER_PASSWORD='Repl@123456',
MASTER_LOG_FILE='mysql-bin.000001',
MASTER_LOG_POS=156;
# 启动从库同步进程
START SLAVE;
# 查看从库状态（确保Slave_IO_Running与Slave_SQL_Running均为Yes）
SHOW SLAVE STATUS\G;

3、从库 2（192.168.1.12）配置：与从库 1 一致，仅需修改server-id=12。

3.1.4、验证主从复制

1、主库创建测试库表：

# 主库创建用户库user_db0与订单库order_db0
CREATE DATABASE user_db0 CHARACTER SET utf8mb4;
CREATE DATABASE order_db0 CHARACTER SET utf8mb4;
# 在user_db0创建用户分表user_0
USE user_db0;
CREATE TABLE user_0 (id BIGINT PRIMARY KEY AUTO_INCREMENT,user_id VARCHAR(32) NOT NULL COMMENT '用户唯一ID',username VARCHAR(64) NOT NULL COMMENT '用户名',phone VARCHAR(20) NOT NULL COMMENT '手机号',create_time DATETIME DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',UNIQUE KEY uk_user_id (user_id)
) COMMENT '用户分表0';

2、从库验证同步：登录从库 1/2，查看是否自动创建user_db0库与user_0表，且结构一致，确认主从同步正常。

3.2、步骤 2：部署 MyCat（中间件节点）

3.2.1、环境要求

JDK 1.8+（MyCat 基于 Java 开发）；

服务器：192.168.1.13（MyCat 节点，与 MySQL 集群网络互通）。

3.2.2、安装 MyCat（1.6.7.6 版本，稳定版）

下载并解压 MyCat：

# 下载MyCat压缩包
wget http://dl.mycat.org.cn/1.6.7.6/20220524174525/Mycat-server-1.6.7.6-release-linux.tar.gz
# 解压到/usr/local目录
tar -zxvf Mycat-server-1.6.7.6-release-linux.tar.gz -C /usr/local/
# 重命名为mycat
mv /usr/local/Mycat-server-1.6.7.6-release /usr/local/mycat

配置环境变量：

# 编辑/etc/profile，添加MyCat路径
echo 'export MYCAT_HOME=/usr/local/mycat' >> /etc/profile
echo 'export PATH=$PATH:$MYCAT_HOME/bin' >> /etc/profile
# 生效环境变量
source /etc/profile

启动 MyCat 并验证：

# 启动MyCat（console模式：前台运行，便于查看日志；后台运行用start）
mycat console
# 验证端口（MyCat默认端口：8066（数据端口）、9066（管理端口））
netstat -tuln | grep 8066
# 输出tcp6       0      0 :::8066                 :::*                    LISTEN，表示启动成功

四、MyCat 核心配置：实现水平分库分表与读写分离

MyCat 的配置文件集中在/usr/local/mycat/conf目录，核心配置文件包括schema.xml（分库分表结构）、rule.xml（拆分规则）、server.xml（用户与权限），需按 “订单 + 用户” 业务场景定制。

4.1、步骤 1：配置 schema.xml（分库分表与读写分离路由）

schema.xml定义逻辑库、逻辑表与物理库表的映射关系，以及读写分离的主从节点配置，核心内容如下：

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/"><!-- 1. 定义逻辑库：与业务端访问的库名一致 --><schema name="mycat_order_user" checkSQLschema="false" sqlMaxLimit="100"><!-- 1.1 逻辑表：用户表（水平分库分表） --><table name="user" dataNode="user_db0,user_db1,user_db2,user_db3" rule="mod-userid" primaryKey="id" autoIncrement="true"><!-- 分表配置：每个数据节点（库）包含2个分表（user_0,user_1） --><childTable name="user_0" primaryKey="id" autoIncrement="true"/><childTable name="user_1" primaryKey="id" autoIncrement="true"/></table><!-- 1.2 逻辑表：订单表（水平分库分表，关联用户表） --><table name="order" dataNode="order_db0,order_db1,order_db2,order_db3" rule="mod-userid-time" primaryKey="id" autoIncrement="true"><childTable name="order_2024" primaryKey="id" autoIncrement="true"/> <!-- 2024年订单分表 --><childTable name="order_2025" primaryKey="id" autoIncrement="true"/> <!-- 2025年订单分表 --></table></schema><!-- 2. 定义数据节点（物理库）：映射MySQL主从集群的库 --><dataNode name="user_db0" dataHost="mysql_master" database="user_db0"/><dataNode name="user_db1" dataHost="mysql_master" database="user_db1"/><dataNode name="user_db2" dataHost="mysql_master" database="user_db2"/><dataNode name="user_db3" dataHost="mysql_master" database="user_db3"/><dataNode name="order_db0" dataHost="mysql_master" database="order_db0"/>

关键参数说明（确保读写分离与高可用）：

balance：读负载均衡策略，1表示 “所有读请求分发到从库，主库不处理读请求”（推荐）；

writeType：写请求路由策略，0表示 “所有写请求路由到第一个 writeHost（主库）”；

switchType：主从切换策略，1表示 “基于 MySQL 主从同步状态自动切换”（主库故障时，从库升级为临时主库）；

slaveThreshold：从库同步延迟阈值（单位：秒），超过该阈值的从库将被排除在读写分离之外，避免读取脏数据。

4.2、步骤 2：配置 rule.xml（定义分库分表规则）

rule.xml用于定义拆分规则（如用户 ID 哈希、时间范围拆分），需为用户表和订单表分别配置专属规则。

4.2.1、配置用户表拆分规则（mod-userid：用户 ID 哈希）

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/"><!-- 1. 定义用户ID哈希规则（mod-userid） --><tableRule name="mod-userid"><rule><!-- 拆分字段：用户表的user_id字段 --><columns>user_id</columns><!-- 拆分算法：哈希取模 --><algorithm>mod-userid-algorithm</algorithm></rule></tableRule><!-- 2. 定义哈希取模算法（分4个库，每个库2个表，共8个分表） --><function name="mod-userid-algorithm" class="io.mycat.route.function.PartitionByMod"><!-- 分表数量：8（4库×2表） --><property name="count">8</property></function><!-- 3. 定义订单表拆分规则（mod-userid-time：用户ID哈希+时间范围） --><tableRule name="mod-userid-time"><rule><!-- 多字段拆分：先按user_id哈希，再按create_time时间范围 --><columns>user_id,create_time</columns><algorithm>mod-userid-time-algorithm</algorithm></rule></tableRule><!-- 4. 定义用户ID+时间范围组合算法 --><function name="mod-userid-time-algorithm" class="io.mycat.route.function.PartitionByMultiKeyMod"><!-- 分库数量：4 --><property name="dbCount">4</property><!-- 每个库的分表数量：2 --><property name="tableCount">2</property><!-- 时间字段格式：yyyy-MM-dd HH:mm:ss --><property name="dateFormat">yyyy-MM-dd HH:mm:ss</property><!-- 时间范围拆分粒度：1年（订单表按年拆分，如order_2024、order_2025） --><property name="sPartionDay">365</property></function>
</mycat:rule>

规则逻辑说明：

用户表：通过PartitionByMod算法，将user_id哈希后对 8 取模（user_id.hashCode() % 8），结果 0~7 分别对应user_db0.user_0、user_db0.user_1、user_db1.user_0...user_db3.user_1；

订单表：通过PartitionByMultiKeyMod算法，先按user_id哈希定位分库，再按create_time的年份定位分表（2024 年订单存order_2024，2025 年存order_2025），确保 “查询某用户 2024 年订单” 时仅访问 1 个分库的 1 个分表。

4.3、步骤 3：配置 server.xml（用户权限与全局参数）

server.xml用于配置 MyCat 的访问用户、权限及全局参数（如连接池大小、SQL 拦截），核心配置如下：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/"><!-- 1. 全局参数配置 --><system><!-- 连接池最大连接数 --><property name="maxConcurrentConnections">5000</property><!-- SQL执行超时时间（单位：秒） --><property name="sqlExecuteTimeout">300</property><!-- 开启SQL日志（生产环境建议关闭，避免性能损耗） --><property name="sqlLogEnable">false</property><!-- 禁止非分片字段查询（避免全表扫描，提升性能） --><property name="filterNonShardingColumn">true</property></system><!-- 2. 配置访问用户（业务端通过该用户连接MyCat） --><user name="mycat_user" defaultAccount="true"><property name="password">MyCat@123456</property><!-- 关联逻辑库（与schema.xml中的逻辑库名一致） --><property name="schemas">mycat_order_user</property><!-- 权限控制（可选，精细化控制表级权限） --><privileges check="true"><schema name="mycat_order_user" dml="0110" ><table name="user" dml="0110"></table><table name="order" dml="0110"></table></schema></privileges></user><!-- 3. 管理员用户（用于MyCat管理，如执行DDL） --><user name="mycat_admin"><property name="password">MyCatAdmin@123</property><property name="schemas">mycat_order_user</property><property name="readOnly">false</property></user>
</mycat:server>

关键参数说明：

dml 权限：0110表示 “允许 INSERT、UPDATE，禁止 DELETE、SELECT”（二进制位对应：SELECT (1)、INSERT (2)、UPDATE (4)、DELETE (8)，0110即二进制6，对应 INSERT+UPDATE）；

filterNonShardingColumn：开启后，若 SQL 未包含分片字段（如用户表查询未带user_id），MyCat 将直接拒绝执行，避免触发全表扫描（多库多表联合查询）。

五、业务实战：验证分库分表与读写分离

配置完成后，需通过业务 SQL 验证 “数据正确拆分” 与 “读写请求路由正确”，确保方案符合预期。

5.1、步骤 1：创建物理分库分表（初始化数据存储）

MyCat 仅负责路由，物理库表需手动在 MySQL 主库创建（主从复制会自动同步到从库）：

-- 1. 在主库创建4个用户库与对应的分表
CREATE DATABASE IF NOT EXISTS user_db0 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS user_db1 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS user_db2 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS user_db3 CHARACTER SET utf8mb4;-- user_db0创建user_0、user_1
USE user_db0;
CREATE TABLE user_0 (id BIGINT PRIMARY KEY AUTO_INCREMENT, user_id VARCHAR(32) NOT NULL UNIQUE, username VARCHAR(64) NOT NULL, phone VARCHAR(20) NOT NULL, create_time DATETIME DEFAULT CURRENT_TIMESTAMP);
CREATE TABLE user_1 (id BIGINT PRIMARY KEY AUTO_INCREMENT, user_id VARCHAR(32) NOT NULL UNIQUE, username VARCHAR(64) NOT NULL, phone VARCHAR(20) NOT NULL, create_time DATETIME DEFAULT CURRENT_TIMESTAMP);-- 其他用户库（user_db1~user_db3）执行相同的分表创建语句（略）-- 2. 在主库创建4个订单库与对应的分表
CREATE DATABASE IF NOT EXISTS order_db0 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS order_db1 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS order_db2 CHARACTER SET utf8mb4;
CREATE DATABASE IF NOT EXISTS order_db3 CHARACTER SET utf8mb4;-- order_db0创建order_2024、order_2025
USE order_db0;
CREATE TABLE order_2024 (id BIGINT PRIMARY KEY AUTO_INCREMENT, order_id VARCHAR(32) NOT NULL UNIQUE, user_id VARCHAR(32) NOT NULL, amount DECIMAL(10,2) NOT NULL, create_time DATETIME DEFAULT CURRENT_TIMESTAMP);
CREATE TABLE order_2025 (id BIGINT PRIMARY KEY AUTO_INCREMENT, order_id VARCHAR(32) NOT NULL UNIQUE, user_id VARCHAR(32) NOT NULL, amount DECIMAL(10,2) NOT NULL, create_time DATETIME DEFAULT CURRENT_TIMESTAMP);-- 其他订单库（order_db1~order_db3）执行相同的分表创建语句（略）

5.2、步骤 2：验证分库分表（插入与查询数据）

通过 MySQL 客户端连接 MyCat（数据端口 8066），执行 SQL 验证数据拆分：

5.2.1、插入用户数据（验证分库分表）

-- 连接MyCat
mysql -h 192.168.1.13 -P 8066 -u mycat_user -pMyCat@123456-- 切换到逻辑库
USE mycat_order_user;-- 插入3条用户数据（user_id分别为u001、u002、u003）
INSERT INTO user (user_id, username, phone) VALUES 
('u001', '张三', '13800138000'),
('u002', '李四', '13900139000'),
('u003', '王五', '13700137000');

验证数据拆分：

登录 MySQL 主库user_db0，查询user_0、user_1，发现u001可能存储在user_db1.user_0（取决于哈希结果）；

登录其他用户库（user_db1~user_db3），可找到对应user_id的记录，证明数据按规则拆分到不同分库分表。

5.3、步骤 3：验证读写分离（写主库、读从库）

通过 “插入数据 + 主从查询对比” 验证读写分离：

5.3.1、插入订单数据（写请求路由到主库）

-- MyCat中插入2024年订单（create_time为2024年）
INSERT INTO `order` (order_id, user_id, amount, create_time) VALUES 
('o2024001', 'u001', 99.90, '2024-01-15 10:30:00'),
('o2024002', 'u002', 199.50, '2024-02-20 14:15:00');

5.3.2、验证写主库：

登录 MySQL 主库order_db0，查询order_2024，可看到插入的订单记录；

登录从库 1（192.168.1.11）order_db0，等待 1~2 秒（主从同步延迟），也能看到相同记录，证明写请求路由到主库且同步正常。

5.3.3、验证读从库：

1、临时停止从库 1 同步：

-- 登录从库1，停止SQL线程（模拟从库数据未更新）
STOP SLAVE SQL_THREAD;

2、主库插入新订单：

-- 主库插入2024年新订单（o2024003）
INSERT INTO order_db0.order_2024 (order_id, user_id, amount, create_time) VALUES 
('o2024003', 'u003', 299.00, '2024-03-10 09:45:00');

3、MyCat 查询订单：

-- MyCat中查询所有订单（读请求）
SELECT * FROM `order` WHERE create_time BETWEEN '2024-01-01' AND '2024-12-31';

结果仅显示o2024001、o2024002，未显示o2024003（从库 1 未同步，从库 2 正常同步，但 MyCat 负载均衡到从库 1）；

证明读请求路由到从库，而非主库，读写分离生效。

六、生产环境优化：性能与高可用保障

6.1、分库分表优化：避免常见性能陷阱

6.1.1、避免跨库 Join 查询

MyCat 对跨库 Join 支持有限，且性能差，需通过业务设计规避：

方案：将关联数据冗余（如订单表冗余username，避免查询订单时 Join 用户表）；

替代：若必须关联，通过业务端分两次查询（先查订单表，再查用户表），而非依赖 MyCat 跨库 Join。

6.1.2、合理设置分表粒度

用户表：按用户 ID 哈希分 8~16 个分表，单表数据控制在 1000 万条以内；

订单表：按 “用户 ID + 年月” 拆分（如order_202401），单表数据控制在 500 万条以内，便于后续归档（如 2023 年订单归档到冷备库）。

6.1.3、预拆分未来分表

订单表按时间拆分时，需提前创建未来的分表（如 2024 年底创建 2025 年的order_2025表），避免因分表不存在导致插入失败，可通过定时任务自动创建。

6.2、读写分离优化：减少数据一致性风险

6.2.1、控制主从同步延迟

优化主库 binlog：使用binlog-format=ROW模式，减少同步数据量；

从库并行复制：MySQL 8.0 + 开启 slave_parallel_type=LOGICAL_CLOCK，支持按事务逻辑时钟并行应用中继日志，降低同步延迟；
从库资源保障：确保从库 CPU、内存、IO 资源不低于主库（如从库磁盘使用 SSD），避免从库性能不足导致同步堆积。

6.2.2、关键业务强制读主库

部分场景需确保数据实时性（如用户下单后立即查询订单状态），需配置 MyCat 强制将读请求路由到主库，通过 SQLHint 实现：

-- 强制读主库（添加/*#mycat:db_type=master*/Hint）
SELECT /*#mycat:db_type=master*/ * FROM `order` WHERE order_id = 'o2024003';

适用场景：订单创建后查询、用户支付后余额查询等强实时性需求；

配置补充：也可在schema.xml中为表配置needMaster属性（needMaster="true"），强制该表所有读请求走主库。

6.3、 MyCat 高可用：避免中间件单点故障

MyCat 作为中间件，若单节点部署会成为系统瓶颈，需通过 “MyCat 集群 + 负载均衡” 实现高可用。

6.3.1、部署 MyCat 集群（2 节点）

1、节点规划：

MyCat 节点 1：192.168.1.13（主节点）；

MyCat 节点 2：192.168.1.14（备节点）；

2、配置同步：

将节点 1 的conf目录（schema.xml、rule.xml、server.xml）完整复制到节点 2，确保配置一致；

启动两个 MyCat 节点（mycat start），验证节点状态（mycat status显示Running）。

6.3.2、配置 Nginx 负载均衡（MyCat 入口）

1、Nginx 配置：

http {# MyCat集群 upstreamupstream mycat_cluster {server 192.168.1.13:8066 weight=1 max_fails=2 fail_timeout=30s;server 192.168.1.14:8066 weight=1 max_fails=2 fail_timeout=30s;}server {listen 8066; # 与MyCat数据端口一致server_name mycat.example.com;location / {proxy_pass http://mycat_cluster;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_next_upstream error timeout invalid_header; # 节点故障自动切换}}
}

2、业务端连接：业务端通过 Nginx 地址（mycat.example.com:8066）连接 MyCat，Nginx 自动实现负载均衡与故障切换（某节点故障时，请求自动路由到另一节点）。

6.4、监控告警：实时感知系统状态

6.4.1、 MyCat 监控（基于 MyCat-Web）

MyCat-Web 是官方监控工具，支持监控 MyCat 连接数、SQL 执行量、分表路由情况：

1、部署 MyCat-Web：

# 下载MyCat-Web
wget https://github.com/MyCATApache/Mycat-Web/archive/refs/tags/1.0.zip
# 解压并启动（依赖JDK 1.8+）
unzip 1.0.zip && cd Mycat-Web-1.0 && sh start.sh

2、访问监控页面：浏览器打开http://192.168.1.13:8082，添加 MyCat 节点（IP:9066，管理端口），监控核心指标：

连接数：Total Connections（避免超过maxConcurrentConnections）；

SQL 执行：SQL Execute Count（异常波动时排查慢 SQL）；

路由成功率：Route Success Rate（低于 100% 时排查分表规则错误）。

6.4.2、 MySQL 主从监控（基于 Prometheus+Grafana）

导入 MySQL 主从监控模板：Grafana 导入模板 ID（7362），监控主从同步状态；
核心告警指标：

mysql_slave_status_slave_io_running：从库 IO 线程状态（0：异常，需告警）；

mysql_slave_status_slave_sql_running：从库 SQL 线程状态（0：异常，需告警）；

mysql_slave_status_seconds_behind_master：主从同步延迟（超过 30 秒，需告警）。

七、常见问题与解决方案

7.1、问题 1：MyCat 插入数据时报 “Table not found”

原因：

物理分表未创建（如订单表order_2024未在order_db0中创建）；
分表规则错误（如user_id哈希结果超出分表数量范围）；

解决方案：

检查所有分库是否创建对应分表（可通过脚本批量创建）；
验证rule.xml中count参数与分表数量一致（如用户表分 8 表，count=8）。

7.2、问题 2：主从同步延迟超过阈值，读请求仍路由到从库

原因：

schema.xml中slaveThreshold配置过大（如设为 300 秒，延迟 200 秒未触发排除）；
MyCat 心跳检测 SQL 未正确获取同步延迟（如select user()无法反映延迟）；

解决方案：

调整slaveThreshold为合理值（生产环境建议 30 秒）；
更换心跳检测 SQL 为show slave status，确保 MyCat 正确获取Seconds_Behind_Master：

<heartbeat>show slave status</heartbeat>

7.3、问题 3：MyCat 执行跨库 Join 查询时报 “Cross DB Join not supported”

原因：MyCat 默认禁止跨库 Join，避免性能损耗；

解决方案：

业务端拆分查询（先查订单表，再查用户表，内存中关联）；
若必须跨库 Join，在server.xml中关闭禁止开关（不推荐，需评估性能）：

<property name="disableCrossDBJoin">false</property>

7.4、问题 4：MyCat 集群中某节点故障，业务请求未自动切换

原因：

Nginxmax_fails或fail_timeout配置不合理（如max_fails=10，故障时需 10 次失败才切换）；
MyCat 管理端口（9066）故障，Nginx 无法检测节点存活；

解决方案：

调整 Nginx 配置（max_fails=2，fail_timeout=30s），减少切换延迟；
确保 MyCat 管理端口（9066）正常（telnet 192.168.1.13 9066），必要时重启 MyCat。

八、结语：MyCat 在海量数据场景中的价值与实践建议

MyCat 通过 “水平分库分表 + MySQL 读写分离” 的组合，从 “数据拆分” 与 “请求分流” 两个维度，彻底解决了单库单表的性能瓶颈，尤其适合电商、金融等 “高并发 + 海量数据” 场景。其核心优势在于 “透明化”—— 业务端无需感知数据存储位置与读写路由，仅通过标准 MySQL 协议即可访问，大幅降低了分布式改造门槛。

8.1、核心实践建议

1、分表规则设计优先业务：

用户表按 “用户 ID 哈希” 拆分，确保查询用户数据时仅访问单表；

订单表按 “用户 ID + 时间” 双维度拆分，兼顾实时查询与历史数据归档（如每年订单归档到冷备库）。

2、读写分离需平衡实时性与性能：

非实时业务（如订单列表查询）走从库，减轻主库压力；

强实时业务（如支付后查询）通过 SQLHint 强制走主库，避免数据不一致。

3、高可用部署不可少：

MyCat 需集群部署 + Nginx 负载均衡，避免中间件单点故障；

MySQL 主从需配置半同步复制 + 备用主库，确保数据安全与故障快速切换。

8.2、未来演进方向

随着业务数据量进一步增长（如订单量达 10 亿级），可基于 MyCat 向更精细化的分布式架构演进：

冷热数据分离：将历史订单（如 2023 年及之前）迁移到低成本存储（如对象存储 + ClickHouse），MyCat 通过 “全局表” 路由冷热数据；

多租户隔离：通过 MyCat “schema 隔离” 或 “分表前缀隔离”，实现多租户数据物理隔离，满足 SaaS 业务需求；

云原生适配：结合 K8s 部署 MyCat 与 MySQL 集群，通过 StatefulSet 管理状态，实现自动扩缩容与故障自愈。

总之，MyCat 不仅是 “分库分表工具”，更是海量数据场景下的 “数据库治理中枢”。通过合理的规则设计、完善的高可用部署与监控告警，MyCat 可支撑千万级用户、亿级订单的业务规模，成为企业数字化转型中的核心基础设施。

查看全文

http://www.dtcms.com/a/479062.html