MySQL复合查询全解析:从基础到多表关联与高级技巧
前言:
本文主要讲解了在MySQL中的复合查询,下面是关于本文章所需要数据的建表语句
创建表的语句:
DROP database IF EXISTS `scott`;
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;USE `scott`;DROP TABLE IF EXISTS `dept`;
CREATE TABLE `dept` (`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);DROP TABLE IF EXISTS `emp`;
CREATE TABLE `emp` (`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);DROP TABLE IF EXISTS `salgrade`;
CREATE TABLE `salgrade` (`grade` int(11) DEFAULT NULL COMMENT '等级',`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
1.基本查询回顾:
1.1.查询工资高于500或岗位为MANAGER的雇员,同时还要满足他们的姓名首字母为大写的J
select * from EMP where (sal>500 or job='MANAGER') and ename like 'J%';
'J_' 和'J%' 的区别
这里‘J_’和‘J%’的主要区别在于它们所代表的字符串匹配模式的严格程度和范围。‘J_’更为严格,只匹配特定长度的字符串;而‘J%’则更为灵活,能匹配任意长度的字符串(只要以‘J’开头)。
1.2.按照部门号升序而雇员的工资降序排序
select * from EMP order by deptno, sal desc;
排序的时候默认是升序,降序需要自己写desc
1.3.使用年薪进行降序排序
注意为空的情况,要使用函数ifnull进行转换为0,不然用null参与计算还是null
函数ifnull()的用法
为什么最终的年薪是NULL呢,因为我们在表中发现有人的奖金是NULL,而我们的年薪计算方式就是月薪*12 + 奖金,而NULL是不参与计算的,因此最终的结果就是NULL,所以我们需要使用函数ifnull(comm,0),这样就把所有为NULL的数字变成0
注意前面的年薪使用过''之后,后面的年薪就不用加上引号了。
1.4.显示工资最高的员工的名字和工作岗位
select ename, job from EMP where sal = (select max(sal) from EMP);
这就是复合查询的体现,使用max(sal)获得最大薪资,然后获得最大数的薪资即可。
1.5.显示工资高于平均工资的员工信息
select ename, sal from EMP where sal>(select avg(sal) from EMP);
跟上一题本质是一样的
1.6.显示每个部门的平均工资和最高工资
select deptno, format(avg(sal), 2) , max(sal) from EMP group by deptno;
format()格式化函数的用法
FORMAT(AVG(sal), 2)
的作用是将AVG(sal)
(平均工资)格式化为具有两位小数的形式。
这是没有格式化的效果:
这是格式化数据的效果:
select deptno ,format(avg(sal),2), max(sal) from emp group by deptno;
1.7.显示平均工资低于2000的部门号和它的平均工资
select deptno, avg(sal) as avg_sal from EMP group by deptno having
avg_sal<2000;
为什么不能用where?
在SQL中,WHERE
和HAVING
子句有不同的用途,这就是为什么在你的查询中不能使用WHERE
来过滤聚合结果。
WHERE
和 HAVING
的区别
WHERE
子句:- 用途:
WHERE
用于在数据聚合之前过滤行。它不能用于过滤聚合函数的结果。 - 执行顺序:在SQL查询中,
WHERE
子句在GROUP BY
之前执行。因此,它只能用于过滤单个行,而不是聚合后的结果。 - 适用性:
WHERE
适用于在分组前对行进行过滤,例如,过滤出特定部门的员工。
- 用途:
HAVING
子句:- 用途:
HAVING
用于在数据聚合之后过滤组。它可以用于过滤聚合函数的结果。 - 执行顺序:
HAVING
子句在GROUP BY
之后执行,因此它可以用于过滤聚合后的结果。 - 适用性:
HAVING
适用于过滤聚合后的结果,例如,过滤出平均工资大于2000的部门。
- 用途:
为什么不能使用WHERE
在你的查询中,你想过滤出平均工资大于2000的部门。由于平均工资是一个聚合结果,你需要使用HAVING
来过滤这个结果。WHERE
不能用于这个目的,因为它在聚合之前执行,无法访问聚合函数的结果。
1.8.显示每种岗位的雇员总数,平均工资
select job,count(*), format(avg(sal),2) from EMP group by job;
统计全部人数直接用count(*)。
2. 多表查询
实际开发中往往数据来自不同的表,所以需要多表查询。本节我们用一个简单的公司管理系统,有三张表EMP,DEPT,SALGRADE来演示如何进行多表查询。
案例:
2.1.显示雇员名、雇员工资以及所在部门的名字
因为上面的数据来自EMP和DEPT表,因此要联合查询。
其实我们只要emp表中的deptno = dept表中的deptno字段的记录
select EMP.ename, EMP.sal, DEPT.dname from EMP, DEPT where EMP.deptno =
DEPT.deptno;
显示部门号为10的部门名,员工名和工资
select ename, sal,dname from EMP, DEPT where EMP.deptno=DEPT.deptno and
DEPT.deptno = 10;
注意判断条件用and进行连接,不要直接连着写。
2.2.显示各个员工的姓名,工资,及工资级别
select ename, sal, grade from emp,salgrade where emp.sal between losal and hisal;
3.自连接
自连接是指在同一张表连接查询
案例:
3.1.显示员工FORD的上级领导的编号和姓名(mgr是员工领导的编号--empno)
使用的子查询:
select empno,ename from emp where emp.empno=(select mgr from emp where
ename='FORD');
使用多表查询(自查询)
-- 使用到表的别名
--from emp leader, emp worker,给自己的表起别名,因为要先做笛卡尔积,所以别名可以先识
别
select leader.empno,leader.ename from emp leader, emp worker where
leader.empno = worker.mgr and worker.ename='FORD';
4.子查询
子查询是指嵌入在其他sql语句中的select语句,也叫嵌套查询
4.1 单行子查询
返回一行记录的子查询
4.1.1.显示SMITH同一部门的员工
select * from EMP WHERE deptno = (select deptno from EMP where
ename='smith');
4.2 多行子查询
返回多行记录的子查询
4.2.1.in关键字;
查询和10号部门的工作岗位相同的雇员的名字,岗位,工资,部门号,但是不包含10自
己的
如果用 = 就会报错,因为查询结果是多行,所以要用 in 关键字
select ename,job,sal,deptno from emp where job in (select distinct job from
emp where deptno=10) and deptno<>10;
4.2.2.all关键字;
显示工资比部门30的所有员工的工资高的员工的姓名、工资和部门号
mysql> select ename, sal, deptno from emp where sal > all(select sal from emp where deptno=30);
当然直接用函数书写也可以。
select ename,sal,deptno from emp where sal > (select max(sal) from emp where deptno = 30);
4.2.3.any关键字;
显示工资比部门30的任意员工的工资高的员工的姓名、工资和部门号(包含自己部门
的员工)
select ename, sal, deptno from EMP where sal > any(select sal from EMP where
deptno=30);
当然用min函数也可以:
select ename,sal,deptno from emp where sal > (select min(sal) from emp where deptno = 30);
4.3 多列子查询
单行子查询是指子查询只返回单列,单行数据;多行子查询是指返回单列多行数据,都是针对单列而言的,而多列子查询则是指查询返回多个列数据的子查询语句
案例:
4.3.1.查询和SMITH的部门和岗位完全相同的所有雇员,不含SMITH本人
代码:
mysql> select ename from EMP where (deptno, job)=(select deptno, job from EMP
where ename='SMITH') and ename <> 'SMITH';
注意点:
顺序必须一致,不然就会报错
嵌套的select语句必须加上括号
4.4 在from子句中使用子查询
子查询语句出现在from子句中。这里要用到数据查询的技巧,把一个子查询当做一个临时表使用。
案例:
4.4.1.显示每个高于自己部门平均工资的员工的姓名、部门、工资、平均工资
获取各个部门的平均工资,将其看作临时表
//获取各个部门的平均工资,将其看作临时表
select ename, deptno, sal, format(asal,2) from EMP,
(select avg(sal) asal, deptno dt from EMP group by deptno) tmp
where EMP.sal > tmp.asal and EMP.deptno=tmp.dt;
4.4.2.查找每个部门工资最高的人的姓名、工资、部门、最高工资
select ename, sal,emp.deptno,最高工资 from emp, (select deptno ,max(sal) '最高工资' from emp group by deptno) tmp where emp.deptno = tmp.deptno and emp.sal = 最高工资;
4.4.3.显示每个部门的信息(部门名,编号,地址)和人员数量
-- 1. 对EMP表进行人员统计
select count(*), deptno from EMP group by deptno;
-- 2. 将上面的表看作临时表
select DEPT.deptno, dname, mycnt, loc from DEPT,
(select count(*) mycnt, deptno from EMP group by deptno) tmp
where DEPT.deptno=tmp.deptno;
4.5 合并查询
在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all
4.5.1 union(自动去重)
该操作符用于取得两个结果集的并集。当使用该操作符时,会自动去掉结果集中的重复行。
案例:将工资大于2500或职位是MANAGER的人找出来
select * from emp where sal > 2500 union select * from emp where job = 'MANAGER';
4.5.3 union all(不去重)
该操作符用于取得两个结果集的并集。当使用该操作符时,不会去掉结果集中的重复行。
案例:将工资大于25000或职位是MANAGER的人找出来
select * from emp where sal > 2500 union all select * from emp where job = 'MANAGER';
5.表的内连和外连
5.1 内连接
内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,我们前面学习的查询都是内连接,也是在开发过程中使用的最多的连接查询。
语法:
select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件;
备注:前面学习的都是内连接
案例:显示SMITH的名字和部门名称
-- 用前面的写法
select ename, dname from EMP, DEPT where EMP.deptno=DEPT.deptno and
ename='SMITH';
-- 用标准的内连接写法
select ename, dname from EMP inner join DEPT on EMP.deptno=DEPT.deptno and
ename='SMITH';
5.2 外连接
外连接分为左外连接和右外连接
5.2.1 左外连接
如果联合查询,左侧的表完全显示我们就说是左外连接。
语法:
select 字段名 from 表名1 left join 表名2 on 连接条件
案例:
-- 建两张表
create table stu (id int, name varchar(30)); -- 学生表
insert into stu values(1,'jack'),(2,'tom'),(3,'kity'),(4,'nono');
create table exam (id int, grade int); -- 成绩表
insert into exam values(1, 56),(2,76),(11, 8);
查询所有学生的成绩,如果这个学生没有成绩,也要将学生的个人信息显示出来
-- 当左边表和右边表没有匹配时,也会显示左边表的数据
select * from stu left join exam on stu.id=exam.id;
如果我们使用内连接,左表的数据就不会完全显示出来,但是用左连接,左表的数据就算为空也会显示出来!
5.2.2 右外连接
如果联合查询,右侧的表完全显示我们就说是右外连接。
语法:
select 字段 from 表名1 right join 表名2 on 连接条件;
其实左连接和右连接是一样的,如果将两个表名交换过来,左连接也可以是右连接!
案例:
对stu表和exam表联合查询,把所有的成绩都显示出来,即使这个成绩没有学生与它对应,也要
显示出来
select * from stu right join exam on stu.id=exam.id;
左连接和右连接的互相转换:
列出部门名称和这些部门的员工信息,同时列出没有员工的部门
方法一:
select d.dname, e.* from dept d left join emp e on d.deptno=e.deptno;
方法二:
select d.dname, e.* from emp e right join dept d on d.deptno=e.deptno;
总结:
小技巧:
任何时刻,查询出来的临时结构,本质在逻辑上也是表结构。
解决多表问题的本质:想办法将多表转化为单表,所以MySQL中,所有select的问题全部都可以转成单表问题!