mySQL的group by用法深入探讨
2019-05-15 本文已影响0人
虚无一代
先上网上目前的结论:
- 必須出現在where之後,order by之前
- select中的列名必須是分組列或者列函數
但是,其实这个结论是不完整的。
先看表:
-
Student table
-
Apply table
现在,以下的group by是正确的:
select sname, count(distinct uName)
from Apply join Student using (sid)
group by (sid)
;
其实,其中sname换成sid, score, sssize都是对的
按理说按照最开始的结论,应该只有sid对才对的
而以下的是错误的:
select uName, count(distinct uName)
from Apply join Student using (sid)
group by (sid)
;
其实,uName换成degree、decision都是错的。
原因是:
结论还要加上:select中的列名不是分组列且不写在聚合函数里也是可以的,但是前提是该列名和分组列应该是一一对应关系
原理是:
首先要明确group by的每一个组在之后生成的查询结果表中肯定都是只占一行的。
所以先解释一下为什么聚合函数出现在select中肯定是没问题的:因为聚合函数生成的只有一个值,在生成表中只占用一格。
然后解释为什么上面的sname以及score以及sssize都可以,因为他们三个属性都和sid是一一对应关系(在Student表里面sid是主键,决定他们仨),所以他们仨在生成表里面也都只占用一格。
最后解释为什么degree那些要报错,因为他们在join之后的表里面和sid不是一一对应关系,因此在生成表里面就会占用多格,这就不符合atomic的标准了。
源于和舍友的讨论 <杨~叶>