当前位置：首页 > news >正文

MySQL复合查询全解析：从基础到多表关联与高级技巧

news 2025/10/31 22:42:19

前言：

本文主要讲解了在MySQL中的复合查询，下面是关于本文章所需要数据的建表语句

创建表的语句：

DROP database IF EXISTS `scott`;
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;USE `scott`;DROP TABLE IF EXISTS `dept`;
CREATE TABLE `dept` (`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);DROP TABLE IF EXISTS `emp`;
CREATE TABLE `emp` (`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);DROP TABLE IF EXISTS `salgrade`;
CREATE TABLE `salgrade` (`grade` int(11) DEFAULT NULL COMMENT '等级',`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);

1.基本查询回顾：

1.1.查询工资高于500或岗位为MANAGER的雇员，同时还要满足他们的姓名首字母为大写的J

select * from EMP where (sal>500 or job='MANAGER') and ename like 'J%';

'J_' 和'J%' 的区别

这里‘J_’和‘J%’的主要区别在于它们所代表的字符串匹配模式的严格程度和范围。‘J_’更为严格，只匹配特定长度的字符串；而‘J%’则更为灵活，能匹配任意长度的字符串（只要以‘J’开头）。

1.2.按照部门号升序而雇员的工资降序排序

select * from EMP order by deptno, sal desc;

排序的时候默认是升序，降序需要自己写desc

1.3.使用年薪进行降序排序

注意为空的情况，要使用函数ifnull进行转换为0，不然用null参与计算还是null

函数ifnull（）的用法

为什么最终的年薪是NULL呢，因为我们在表中发现有人的奖金是NULL，而我们的年薪计算方式就是月薪*12 + 奖金，而NULL是不参与计算的，因此最终的结果就是NULL，所以我们需要使用函数ifnull（comm,0），这样就把所有为NULL的数字变成0

注意前面的年薪使用过''之后，后面的年薪就不用加上引号了。

1.4.显示工资最高的员工的名字和工作岗位

select ename, job from EMP where sal = (select max(sal) from EMP);

这就是复合查询的体现，使用max(sal)获得最大薪资，然后获得最大数的薪资即可。

1.5.显示工资高于平均工资的员工信息

select ename, sal from EMP where sal>(select avg(sal) from EMP);

跟上一题本质是一样的

1.6.显示每个部门的平均工资和最高工资

select deptno, format(avg(sal), 2) , max(sal) from EMP group by deptno;

format（）格式化函数的用法

FORMAT(AVG(sal), 2) 的作用是将 AVG(sal)（平均工资）格式化为具有两位小数的形式。

这是没有格式化的效果：

这是格式化数据的效果：

select deptno ,format(avg(sal),2), max(sal) from emp group by deptno;

1.7.显示平均工资低于2000的部门号和它的平均工资

select deptno, avg(sal) as avg_sal from EMP group by deptno having
avg_sal<2000;

为什么不能用where？

在SQL中，WHERE和HAVING子句有不同的用途，这就是为什么在你的查询中不能使用WHERE来过滤聚合结果。

`WHERE` 和 `HAVING` 的区别

WHERE 子句：
- 用途：WHERE用于在数据聚合之前过滤行。它不能用于过滤聚合函数的结果。
- 执行顺序：在SQL查询中，WHERE子句在GROUP BY之前执行。因此，它只能用于过滤单个行，而不是聚合后的结果。
- 适用性：WHERE适用于在分组前对行进行过滤，例如，过滤出特定部门的员工。
HAVING 子句：
- 用途：HAVING用于在数据聚合之后过滤组。它可以用于过滤聚合函数的结果。
- 执行顺序：HAVING子句在GROUP BY之后执行，因此它可以用于过滤聚合后的结果。
- 适用性：HAVING适用于过滤聚合后的结果，例如，过滤出平均工资大于2000的部门。

为什么不能使用`WHERE`

在你的查询中，你想过滤出平均工资大于2000的部门。由于平均工资是一个聚合结果，你需要使用HAVING来过滤这个结果。WHERE不能用于这个目的，因为它在聚合之前执行，无法访问聚合函数的结果。

1.8.显示每种岗位的雇员总数，平均工资

select job,count(*), format(avg(sal),2) from EMP group by job;

统计全部人数直接用count（*）。

2. 多表查询

实际开发中往往数据来自不同的表，所以需要多表查询。本节我们用一个简单的公司管理系统，有三张表EMP,DEPT,SALGRADE来演示如何进行多表查询。

案例：

2.1.显示雇员名、雇员工资以及所在部门的名字

因为上面的数据来自EMP和DEPT表，因此要联合查询。

其实我们只要emp表中的deptno = dept表中的deptno字段的记录

select EMP.ename, EMP.sal, DEPT.dname from EMP, DEPT where EMP.deptno =
DEPT.deptno;

显示部门号为10的部门名，员工名和工资

select ename, sal,dname from EMP, DEPT where EMP.deptno=DEPT.deptno and
DEPT.deptno = 10;

注意判断条件用and进行连接，不要直接连着写。

2.2.显示各个员工的姓名，工资，及工资级别

select ename, sal, grade from emp,salgrade where emp.sal between losal and hisal;

3.自连接

自连接是指在同一张表连接查询

案例：

3.1.显示员工FORD的上级领导的编号和姓名（mgr是员工领导的编号--empno）

使用的子查询：

select empno,ename from emp where emp.empno=(select mgr from emp where
ename='FORD');

使用多表查询（自查询）

-- 使用到表的别名
--from emp leader, emp worker，给自己的表起别名，因为要先做笛卡尔积，所以别名可以先识
别
select leader.empno,leader.ename from emp leader, emp worker where
leader.empno = worker.mgr and worker.ename='FORD';

4.子查询

子查询是指嵌入在其他sql语句中的select语句，也叫嵌套查询

4.1 单行子查询

返回一行记录的子查询

4.1.1.显示SMITH同一部门的员工

select * from EMP WHERE deptno = (select deptno from EMP where
ename='smith');

4.2 多行子查询

返回多行记录的子查询

4.2.1.in关键字；

查询和10号部门的工作岗位相同的雇员的名字，岗位，工资，部门号，但是不包含10自
己的

如果用 = 就会报错，因为查询结果是多行，所以要用 in 关键字

select ename,job,sal,deptno from emp where job in (select distinct job from
emp where deptno=10) and deptno<>10;

4.2.2.all关键字；

显示工资比部门30的所有员工的工资高的员工的姓名、工资和部门号

mysql> select ename, sal, deptno from emp where sal > all(select sal from emp where deptno=30);

当然直接用函数书写也可以。

 select ename,sal,deptno from emp where sal > (select max(sal) from emp where deptno = 30);

4.2.3.any关键字；

显示工资比部门30的任意员工的工资高的员工的姓名、工资和部门号（包含自己部门
的员工）

select ename, sal, deptno from EMP where sal > any(select sal from EMP where
deptno=30);

当然用min函数也可以：

select ename,sal,deptno from emp where sal > (select min(sal) from emp where deptno = 30);

4.3 多列子查询

单行子查询是指子查询只返回单列，单行数据；多行子查询是指返回单列多行数据，都是针对单列而言的，而多列子查询则是指查询返回多个列数据的子查询语句

案例：

4.3.1.查询和SMITH的部门和岗位完全相同的所有雇员，不含SMITH本人

代码：

mysql> select ename from EMP where (deptno, job)=(select deptno, job from EMP
where ename='SMITH') and ename <> 'SMITH';

注意点：
顺序必须一致，不然就会报错

嵌套的select语句必须加上括号

4.4 在from子句中使用子查询

子查询语句出现在from子句中。这里要用到数据查询的技巧，把一个子查询当做一个临时表使用。

案例：

4.4.1.显示每个高于自己部门平均工资的员工的姓名、部门、工资、平均工资

获取各个部门的平均工资，将其看作临时表

//获取各个部门的平均工资，将其看作临时表
select ename, deptno, sal, format(asal,2) from EMP,
(select avg(sal) asal, deptno dt from EMP group by deptno) tmp
where EMP.sal > tmp.asal and EMP.deptno=tmp.dt;

4.4.2.查找每个部门工资最高的人的姓名、工资、部门、最高工资

select ename, sal,emp.deptno,最高工资 from emp, (select deptno ,max(sal) '最高工资' from emp group by deptno) tmp where emp.deptno = tmp.deptno and emp.sal = 最高工资;

4.4.3.显示每个部门的信息（部门名，编号，地址）和人员数量

-- 1. 对EMP表进行人员统计
select count(*), deptno from EMP group by deptno;
-- 2. 将上面的表看作临时表
select DEPT.deptno, dname, mycnt, loc from DEPT,
(select count(*) mycnt, deptno from EMP group by deptno) tmp
where DEPT.deptno=tmp.deptno;

4.5 合并查询

在实际应用中，为了合并多个select的执行结果，可以使用集合操作符 union，union all

4.5.1 union（自动去重）

该操作符用于取得两个结果集的并集。当使用该操作符时，会自动去掉结果集中的重复行。
案例：将工资大于2500或职位是MANAGER的人找出来

select * from emp where sal > 2500 union select * from emp where job = 'MANAGER';

4.5.3 union all（不去重）

该操作符用于取得两个结果集的并集。当使用该操作符时，不会去掉结果集中的重复行。
案例：将工资大于25000或职位是MANAGER的人找出来

select * from emp where sal > 2500 union all select * from emp where job = 'MANAGER';

5.表的内连和外连

5.1 内连接

内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选，我们前面学习的查询都是内连接，也是在开发过程中使用的最多的连接查询。

语法：

select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件；

备注：前面学习的都是内连接

案例：显示SMITH的名字和部门名称

-- 用前面的写法
select ename, dname from EMP, DEPT where EMP.deptno=DEPT.deptno and
ename='SMITH';
-- 用标准的内连接写法
select ename, dname from EMP inner join DEPT on EMP.deptno=DEPT.deptno and
ename='SMITH';

5.2 外连接

外连接分为左外连接和右外连接

5.2.1 左外连接

如果联合查询，左侧的表完全显示我们就说是左外连接。

语法：

select 字段名  from 表名1 left join 表名2 on 连接条件

案例：

-- 建两张表
create table stu (id int, name varchar(30)); -- 学生表
insert into stu values(1,'jack'),(2,'tom'),(3,'kity'),(4,'nono');
create table exam (id int, grade int); -- 成绩表
insert into exam values(1, 56),(2,76),(11, 8);

查询所有学生的成绩，如果这个学生没有成绩，也要将学生的个人信息显示出来

-- 当左边表和右边表没有匹配时，也会显示左边表的数据
select * from stu left join exam on stu.id=exam.id;

如果我们使用内连接，左表的数据就不会完全显示出来，但是用左连接，左表的数据就算为空也会显示出来！

5.2.2 右外连接

如果联合查询，右侧的表完全显示我们就说是右外连接。

语法：

select 字段 from 表名1 right join 表名2  on 连接条件；

其实左连接和右连接是一样的，如果将两个表名交换过来，左连接也可以是右连接！

案例：
对stu表和exam表联合查询，把所有的成绩都显示出来，即使这个成绩没有学生与它对应，也要
显示出来

select * from stu right join exam on stu.id=exam.id;

左连接和右连接的互相转换：
列出部门名称和这些部门的员工信息，同时列出没有员工的部门

方法一：
select d.dname, e.* from dept d left join emp e on d.deptno=e.deptno;
方法二：
select d.dname, e.* from emp e right join dept d on d.deptno=e.deptno;