Group By、Having用法总结(常见踩雷点总结—SQL)_sql group by having用法
Group By、Having用法总结
目录
- Group By、Having用法总结
 - 一、 GROUP BY 用法
 - 二、 HAVING 用法
 - 三、 `GROUP BY` 和 `HAVING` 的常见踩雷点
 

一、 GROUP BY 用法
GROUP BY 子句用来根据一个或多个列将结果集进行分组,常与聚合函数(如 COUNT(), SUM(), AVG(), MAX(), MIN())一起使用。
SELECT column1, column2, aggregate_function(column3)FROM tableGROUP BY column1, column2;
SELECT department, AVG(salary)FROM employeesGROUP BY department;-- 根据 `department` 列对 `employees` 表进行分组,然后计算每个部门的平均工资。
二、 HAVING 用法
HAVING子句用于过滤GROUP BY生成的分组数据。- 它与 
WHERE子句的不同之处在于,WHERE在分组前过滤行,而HAVING是在分组后对结果进行过滤。 
SELECT column1, aggregate_function(column2)FROM tableGROUP BY column1HAVING aggregate_function(column2) condition;
SELECT department, AVG(salary)FROM employeesGROUP BY departmentHAVING AVG(salary) > 50000;-- 返回平均工资大于 50000 的部门。
三、 GROUP BY 和 HAVING 的常见踩雷点
3.1 GROUP BY 选择的列必须出现在 SELECT 中(🤣最重要的一点)
- 
使用
GROUP BY时,SELECT中的非聚合列必须出现在GROUP BY子句中,或者是聚合函数的一部分。 - 
不能在 GROUP BY 后直接选择没有参与分组或没有应用聚合函数的字段,否则 SQL 会报错。
 - 
错误示例:
SELECT department, name, AVG(salary)FROM employeesGROUP BY department;name列没有出现在GROUP BY中,也没有被聚合,会引发错误。 - 
SQL 不知道如何处理 name,因为它没有被分组(GROUP BY 只会根据 department 分组),也没有被聚合(没有 MAX(name) 或 MIN(name))。
 - 
可以去掉 name 字段,或者使用聚合函数对它进行处理。
SELECT department, MIN(name), AVG(salary)FROM employeesGROUP BY department; 
Tips:
- 
在分组后,SQL 已经将多个行数据合并为一个分组(代表一组相关的记录)。
 - 
在这个合并的过程中,SQL 无法直接决定非分组字段应该取什么值,因为每个字段的值在一个分组中可能是不同的。Eg.如果一个部门有多个员工,你无法直接从中选择一个特定的员工姓名,因为在一个分组中,有多个员工姓名。
 - 
That’s why,SQL 只允许你选择分组字段或通过聚合函数“汇总”一个分组中的多个行。
 
来两个正确用法巩固一下脑子哈哈:
 (不能在 GROUP BY 后的 SELECT 中选择没有聚合的字段,或者没有在 GROUP BY 中出现的字段!!!)
SELECT department, job_title, AVG(salary)FROM employeesGROUP BY department, job_title;
SELECT department, job_title, MAX(employee_name), AVG(salary)FROM employeesGROUP BY department, job_title;
3.2 GROUP BY 可以有多个列
- 可以在 
GROUP BY中使用多个列,创建更细致的分组。 
按照 department 和 job_title 进行多列分组:
SELECT department, job_title, COUNT(*)FROM employeesGROUP BY department, job_title;
3.3 GROUP BY 和 ORDER BY 的关系
GROUP BY用于分组数据,而ORDER BY用于排序数据。它们的顺序不一样。- 可以在 
GROUP BY后面使用ORDER BY来对结果进行排序。 
按平均工资降序排序。:
SELECT department, AVG(salary)FROM employeesGROUP BY departmentORDER BY AVG(salary) DESC;-- 按平均工资降序排序。
3.4 聚合函数的计算顺序
- 
GROUP BY会先分组,然后应用聚合函数。如果需要在聚合函数的结果上进一步过滤数据,应该使用HAVING而不是WHERE。SELECT department, SUM(salary)FROM employeesWHERE hire_date > \'2020-01-01\' -- WHERE 在聚合之前GROUP BY department; 
3.5 HAVING 中的聚合函数和常量比较
- 
在
HAVING子句中,通常会看到聚合函数与某个常量进行比较。这样做没有问题,但必须要确保聚合函数的语法正确。SELECT department, COUNT(*)FROM employeesGROUP BY departmentHAVING COUNT(*) > 10; -- 这个是正确的 
3.6 避免在 HAVING 中做不必要的计算
- 
不要在
HAVING中做不必要的计算,可能会导致性能下降。如果能在WHERE中提前过滤,就避免使用HAVING。SELECT department, SUM(salary)FROM employeesWHERE salary > 50000 -- 提前过滤GROUP BY department; 


