sql学习笔记
1基本查询
基本查询 SELECT * FROM <表名>
以查询到一张表的所有记录
2条件查询
条件查询 SELECT * FROM <表名> WHERE <条件表达式>
eg:SELECT * FROM students WHERE score >= 80;
条件表达式可以用<条件1>AND <条件2>
表达满足条件1并且满足条件2。
eg:SELECT * FROM students WHERE score >= 80 AND gender = 'M';
第二种条件是<条件1> OR <条件2>
,表示满足条件1或者满足条件2
eg:SELECT * FROM students WHERE score >= 80 OR gender = 'M';
第三种条件是NOT <条件>
,表示“不符合该条件”的记录。
eg:SELECT * FROM students WHERE NOT class_id = 2;
要组合三个或者更多的条件,就需要用小括号()表示如何进行条件运算。
eg:SELECT * FROM students WHERE (score < 80 OR score > 90) AND gender = 'M';
如果不加括号,条件运算按照NOT
、AND
、OR
的优先级进行,即NOT
优先级最高,其次是AND
,最后是OR
。加上括号可以改变优先级。
常用的条件表达式
条件 | 表达式举例1 | 表达式举例2 | 说明 |
---|---|---|---|
使用=判断相等 | score = 80 | name = 'abc' | 字符串需要用单引号括起来 |
使用>判断大于 | score > 80 | name > 'abc' | 字符串比较根据ASCII码,中文字符比较根据数据库设置 |
使用>=判断大于或相等 | score >= 80 | name >= 'abc' | |
使用<判断小于 | score < 80 | name <= 'abc' | |
使用<=判断小于或相等 | score <= 80 | name <= 'abc' | |
使用<>判断不相等 | score <> 80 | name <> 'abc' | |
使用LIKE判断相似 | name LIKE 'ab%' | name LIKE '%bc%' | %表示任意字符,例如'ab%'将匹配'ab','abc','abcd' |
3投影查询
如果我们只希望返回某些列的数据,而不是所有列的数据,我们可以用SELECT 列1, 列2, 列3 FROM ...
,让结果集仅包含指定列。这种操作称为投影查询。
eg:SELECT id, name FROM students;
使用SELECT 列1, 列2, 列3 FROM ...
时,还可以给每一列起个别名,这样,结果集的列名就可以与原表的列名不同。它的语法是SELECT 列1 别名1, 列2 别名2, 列3 别名3 FROM ...
。
4排序
使用ORDER BY
可以对结果集进行排序; 可以对多列进行升序、倒序排序。
使用SELECT查询时,查询结果集通常是按照id排序的,也就是根据主键排序。这也是大部分数据库的做法。如果我们要根据其他条件排序怎么办?可以加上ORDER BY
子句。例如按照成绩从低到高进行排序:
eg: 按score从低到高SELECT id, name, gender, score FROM students ORDER BY score;
如果要反过来,按照成绩从高到底排序,我们可以加上DESC
表示“倒序”:
按score从高到低SELECT id, name, gender, score FROM students ORDER BY score DESC;
如果score列有相同的数据,要进一步排序,可以继续添加列名。例如,使用ORDER BY score DESC, gender
表示先按score列倒序,如果有相同分数的,再按gender列排序:
默认的排序规则是ASC
:“升序”,即从小到大。ASC
可以省略,即ORDER BY score ASC
和ORDER BY score
效果一样。
如果有WHERE
子句,那么ORDER BY
子句要放到WHERE
子句后面
-- 带WHERE条件的ORDER BY:
SELECT id, name, gender, score
FROM students
WHERE class_id = 1
ORDER BY score DESC;
5分页查询
分页实际上就是从结果集中“截取”出第M~N条记录。这个查询可以通过LIMIT <M> OFFSET <N>
子句实现
eg:SELECT id, name, gender, score FROM students ORDER BY score DESC LIMIT 3 OFFSET 0;
上述查询LIMIT 3 OFFSET 0
表示,对结果集从0号记录开始,最多取3条。注意SQL记录集的索引从0开始。
即
取第1页LIMIT 3 OFFSET 0
取第2页LIMIT 3 OFFSET 3
取第3页LIMIT 3 OFFSET 6
...
LIMIT <pageSize> OFFSET <pageSize*(pageIndex-1)>
pageIndex(从1开始)是页数, pageSize是每页数据最多的条数
6聚合查询
对于统计总数、平均数这类计算,SQL提供了专门的聚合函数,使用聚合函数进行查询,就是聚合查询,它可以快速获得结果。
仍然以查询students表一共有多少条记录为例,我们可以使用SQL内置的COUNT()
函数查询:
SELECT COUNT(*) FROM students;
COUNT(*)
表示查询所有列的行数,要注意聚合的计算结果虽然是一个数字,但查询的结果仍然是一个二维表,只是这个二维表只有一行一列,并且列名是COUNT(*)
。
通常,使用聚合查询时,我们应该给列名设置一个别名,便于处理结果:
使用聚合查询并设置结果集的列名为num:SELECT COUNT(*) num FROM students;
COUNT(*)
和COUNT(id)
实际上是一样的效果。另外注意,聚合查询同样可以使用WHERE
条件,因此我们可以方便地统计出有多少男生、多少女生、多少80分以上的学生等:
SELECT COUNT(*) boys FROM students WHERE gender = 'M';
除了COUNT()
函数外,SQL还提供了如下聚合函数:
函数 | 说明 |
---|---|
SUM | 计算某一列的合计值,该列必须为数值类型 |
AVG | 计算某一列的平均值,该列必须为数值类型 |
MAX | 计算某一列的最大值 |
MIN | 计算某一列的最小值 |
eg:使用聚合查询计算男生平均成绩:
SELECT AVG(score) average FROM students WHERE gender = 'M';
要特别注意:如果聚合查询的WHERE
条件没有匹配到任何行,COUNT()
会返回0,而SUM()
、AVG()
、MAX()
和MIN()
会返回NULL
:
分组聚合
按class_id分组:
SELECT COUNT(*) num FROM students GROUP BY class_id;
执行这个查询,COUNT()
的结果不再是一个,而是3个,这是因为,GROUP BY
子句指定了按class_id
分组,因此,执行该SELECT
语句时,会把class_id
相同的列先分组,再分别计算,因此,得到了3行结果。
但是这3行结果分别是哪三个班级的,不好看出来,所以我们可以把class_id
列也放入结果集中:
SELECT class_id, COUNT(*) num FROM students GROUP BY class_id;
7连接查询
连接查询是另一种类型的多表查询。连接查询对多个表进行JOIN运算,简单地说,就是先确定一个主表作为结果集,然后,把其他表的行有选择性地“连接”在主表结果集上。
内连接——INNER JOIN
-- 选出所有学生SELECT s.id, s.name, s.class_id, s.gender, s.score FROM students s;
选出所有学生,同时返回班级名称
SELECT s.id, s.name, s.class_id, c.name class_name, s.gender, s.score FROM students s INNER JOIN classes c ON s.class_id = c.id;
注意INNER JOIN查询的写法是:
先确定主表,仍然使用FROM <表1>
的语法;
再确定需要连接的表,使用INNER JOIN <表2>
的语法;
然后确定连接条件,使用ON <条件...>
,这里的条件是s.class_id = c.id
,表示students表
的class_id列
与classes表
的id列
相同的行需要连接;
可选:加上WHERE
子句、ORDER BY
等子句。
使用别名不是必须的,但可以更好地简化查询语句。
外连接(OUTER JOIN
)
INNER JOIN
只返回同时存在于两张表的行数据,由于students
表的class_id
包含1,2,3,classes
表的id
包含1,2,3,4,所以,INNER JOIN
根据条件s.class_id = c.id
返回的结果集仅包含1,2,3。
RIGHT OUTER JOIN
返回右表都存在的行。如果某一行仅在右表存在,那么结果集就会以NULL
填充剩下的字段。
LEFT OUTER JOIN
则返回左表都存在的行。如果我们给students
表增加一行,并添加class_id=5
,由于classes
表并不存在id=5
的行,所以,LEFT OUTER JOIN
的结果会增加一行,对应的class_name
是NULL
:
使用FULL OUTER JOIN
,它会把两张表的所有记录全部选择出来,并且,自动把对方不存在的列填充为NULL
对于这么多种JOIN查询,到底什么使用应该用哪种呢?其实我们用图来表示结果集就一目了然了。
假设查询语句是:
SELECT ... FROM tableA ??? JOIN tableB ON tableA.column1 = tableB.column2;
JOIN
查询需要先确定主表,然后把另一个表的数据“附加”到结果集上;
INNER JOIN
是最常用的一种JOIN
查询,它的语法是SELECT ... FROM <表1> INNER JOIN <表2> ON <条件...>;
JOIN
查询仍然可以使用WHERE
条件和ORDER BY
排序。
8 修改数据
增加
使用INSERT
,我们就可以一次向一个表中插入一条或多条记录
INSERT INTO <表名> (字段1, 字段2, ...) VALUES (值1, 值2, ...),(值1, 值2, ...)...;
修改
使用UPDATE
,我们就可以一次更新表中的一条或多条记录
UPDATE <表名> SET 字段1=值1, 字段2=值2, ... WHERE ...;
在UPDATE
语句中,更新字段时可以使用表达式。例如,把所有80分以下的同学的成绩加10分:
UPDATE students SET score=score+10 WHERE score<80;
其中,SET score=score+10
就是给当前行的score字段的值加上了10。
要特别小心的是,UPDATE
语句可以没有WHERE
条件,这时,整个表的所有记录都会被更新
删除
使用DELETE
,我们就可以一次删除表中的一条或多条记录。
DELETE FROM <表名> WHERE ...;