SQL语句整理——基础篇
SQL语句用来操纵数据库的常用通用语言,主要用于oracle,sql server,mysql,access,excel等这些经常容易碰到的数据软件。
sql语句入门并不难,但是知识点十分的琐碎,所以本文作为笔记同样也是总结,将sql语句的基础用法汇总一下,方便以后查阅。
select语句
基础语法
-
基础:select 字段1,字段2,from [表名$]
注意中间的所有标点符号都为英文符号。
image.png - 取出所有字段方法:
- select * from [data$]
- select 编号, 中文名, 英文名, 职业, 城市 from [dataa1:e4]
- 取唯一值记录:
select distinct * from [data$]
条件查询与比较运算符
image.png- 常见的比较运算符有:>(大于) , <(小于) , = (等于) ,>=(大于等于) ,<=(小于等于) ,<>(不等于)
例如:select * from [data$] where 类型="台式机"
sql语句中所有的标点符号都是英文状态输入法输入。
查询单价大于6000的记录。 - select * from [data$] where 单价>6000
- 条件日期查询
日期比较特殊需要在日期的左右分别用#2013/1/8#井号括起来,而且字段名的开头尽量用汉字与字母,数字形式开头的字段名,sql语句极有可能报错。 - select * from [data$] where 销售日期>=#2013/1/8#
也可以将日期转换为数字格式后再做判断。 - select * from [data$] where 销售日期>=41282
数学运算符
常见的数学运算符有加减乘除,当然还有乘方,开方等其他运算。
image.png
- 数学运算在字段中的运用
汇总每条记录所有城市的销售总数量。
- select 销售日期,品牌,类型,单价,北京+上海+成都 from [data$]
汇总各城市销售数量总和大于20台的各品牌各类型的天数 - select * from [data$] where 北京+上海+成都>20
逻辑运算符
常见的逻辑运算符有:not and or 非与或,当然还有亦或,空等。
用法:常用于与数学运算符配合使用的的多条件筛选。
and 同真为真,一假则假
or 一真为真,同假则假
not 非真则假,非假则真
- or 运算符应用
日期大于2013/1/6或者单价大于6000的记录 - select * from [data$] where 销售日期>#2013-1-6# or 单价>6000
同样的sql语句能与数据透视表结合使用满足更为复杂和特殊的筛选汇总方法。 - and运算符运用
日期介于2013-1-5到2013-1-10的记录
select * from [data$] where 销售日期>=#2013-1-5# and 销售日期<=#2013-1-10# - 综合运用
可以实现复杂条件的筛选 - select * from [data$] where 销售日期>#2013-1-5# and 销售日期<=#2013-1-10# and 类型 ="台式" or 单价>7000
in 运算符
in就是在其中,包含的意思
select * from [data$] where 品牌 in("联想","惠普")
列出品牌为IBM,联想,并且类型为台式和笔记本的记录。
-
select * from [data$] where 品牌 in("IBM","联想") and 类型 in ("台式","笔记本")
image.png
如果不用In
- select * from [data$] where (品牌="IBM" or 品牌="联想") and(类型="台式" or 类型="笔记本")
null运算符运用 null 就是空 - select * from [data] where 北京 is not null and 上海 is not null and 成都 is not null
结果
image.png
between运算符
between ... and 会选取介于两个值之间的数据范围。这些值可以是数值、文本或者日期。
- 查询销售日期在2013-1-5到2013-1-10之间的记录
select * from [data$] where 销售日期 between #2013-1-5# and #2013-1-10# - 查询出每天销售单价在5000-7000的记录
select * from [data$] where 单价 between 5000 and 7000
like操作符
- like操作符很好玩,类似于正则表达式的某些功能,当然也有区别。
select 字段 from [表名$] where 字段 like 条件
模糊匹配用到通配符
% 匹配多个字符相当于正则中的* -
短下划线,匹配单个字符相当于?
[] 类似于正则中的字符组
[A-Z] 任意单一字母
[0-9] 任意单一数字
[一-龢]任意单一汉字
[!...] 非字符组范围
例子1
image.png
我们拿到这样一个有些庞大的数据,要求筛选出英文名字在a-c之间的女性。身份证号的倒数第二位为奇数则为男,为偶数则为女。
select * from [data$] where 身份证号 like "%[02468]_" and 英文名 like "[a-c]%" -
注意 like运算符后面的表达式都需要写在""双引号内。
结果:
image.png
$符号与Markdown有些冲突。
连字符的运用
& 连字符就是将不同单元格的内容连接起来。相当于and却有些区别。
image.png
我们想要查询出1月份和尚头的记录
- select * from [data$] where 月份="1月份" and 品名="和尚头"
同样可以用连字符将两个条件连接起来 - select * from [data$] where 月份&品名="1月份和尚头"
order by 语句
用于根据指定的列对结果进行排序
默认为升序排序
-
select 字段 from [表名] order by 字段[asc,desc]升序和降序(此处表名后跟美元符号,输不进去)
image.png
我们拿到数据将总分用sql语句排序
-
select * from [data$] order by 总分 asc
asc可以省略
image.png
我们略微升升级,汇总出前十名中,各职业的平均分
那么首先要用到数据透视表的汇总字段平均分功能。 -
select top 10 * from [data$] order by 总分 desc
image.png
再度升级select的嵌套查询,降序排出最后三名。
- select * from (select top 3 * from [data$] order by 总分 asc) order by 总分 desc
先升序排序出前三项分数最低的三项,然后降序排序。
分组
group by
分组就是归类
写法:select 字段 from [表名$] group by 字段
如果只是分组,没有条件,并不需要where。
image.png
-
select 职业 from [data$] group by 职业
image.png
image.png
查询双列中不重复的记录
- select 品名,型号 from [data1$] group by 品名,型号
分组后的字段会自动升序排列
别名
给原来的字段,新字段,数据源重新取一个另外的名字,作用是简化公式,更好的表达语句。
依旧用电脑那个数据源。
- select *, 北京+上海+成都 as 总量 from [data$] where (北京+上海+成都)>30
重新命名字段 - select *, 北京+上海+成都 as 总量 from [data$] where 总量>30
如果执行这样的语句会报错,期待参数是1,原因是sql语句总是先执行条件where后面的语句,所以单纯的总量是识别不出来的,需要源字段中有总量这个字段。
所以执行下面的语句: - select * from (select *,北京+上海+成都 as 总量 from [data$]) where 总量>30
UNION合并多表字段
union操作符用于合并两个或多个select语句的结果集。
union内部的select语句必须拥有相同数量的列,列也必须拥有相似的数据类型,同时,每条select语句中的列的顺序必须相同。
- select 字段 from [表名]
假如有三张这样的表,表名分别为1月,2月,3月。
ALT+D+D+D引入外部数据源,三张表的每张表都可以当做数据源。
由于$识别在markdown是字体变更符号容易引起问题。所以在表名后要跟美元符号。
- select * from ['1月'] union all select * from ['3月$']
union all是引入所有数据,而想要引入不重复的数据只要union即可。 - select * from ['1月'] union select * from ['3月$']
image.png
union实例应用
比如计算每种产品的库存数,它等于起初数+入库数-出库数。
分别有三张表,期初 入库 出库
期初
入库
出库 - select *,"期初" as 类型 from [期初] union all select *,"出库" from [出库$]
写入数据透视表中方便分析,首先为每张表增加一个字段,期初加入期初表,入库加入入库表,出库加入出库表。注意字段“期初”,要加英文状态的双引号。
image.png
多表连接
将多个有内在联系的表,进行对应连接,叫做多表连接。
产品资料
销量
观察两个表的联系为产品编号。
- select * from [产品资料] t2 where t1.编号=t2.编号
将产品资料表起名为t1,销量表为t2,将他们的编号联系,当然如果产品资料表中的项目缺失会引起数据错误。
依然写入数据透视表中。
image.png
这里要用到数据透视表自带的分组功能。
将其按月分组,最后效果如下:
image.png
多表合并提取不同表的字段
员工表 工资表分红表
- select t1.工号,t1.姓名,t1.城市,t2.月份,t2.工资 from [员工表] t2 where t1.工号=t2.工号
image.png
也可以略微简化 - select t1.工号,姓名,城市,月份,工资 from [员工表] t2 where t1.工号=t2.工号
三张表的合并
- select t3.工号,姓名,工资,分红比例 from [员工表] t2, [分红表$] t3 where t1.工号=t2.工号 and t2.工号= t3.工号
image.png
内连接 inner join
说白了就是不同表之间取相同字段的连接。
期中
期末
期中和期末两张表,将对应姓名的期中和期末成绩汇总。
- select t1.姓名,t1.总分 as 期中,t2.总分 as 期末,期中+期末 as 总分 from [期中] t2 on t1.姓名=t2.姓名
当然我们也可以采用原先的方法,用条件判断来连接字段。 - select t1.姓名,t1.总分 as 期中,t2.总分 as 期末 from [期中] t2 where t1.姓名=t2.姓名
外连接
直白的说,外连接就是以一个字段为基础,连接另一个数据字段,另一个数据字段可以不含本字段项,以本表字段为基础的连接称为左外连接,以外表字段为基础的称为右外连接。不以两表为基础的称为全外连接。
工资
奖金
补贴
- 左外连接
以工资为数据源。 - select t1.姓名,t1.工资, t2.奖金 from[工资] t2 on t1.姓名= t2.姓名
结果 - 右外连接
仍以工资为数据源。 - select t2.姓名,t1.工资, t2.奖金 from[工资] t2 on t1.姓名= t2.姓名
image.png - 全外连接
全外连接比较复杂,原因是excel并没有自带的全外连接功能,需要通过左外连接,右外连接结合使用达到目的。 - select t2.姓名,t1.工资, t2.奖金 from[工资] t2 on t1.姓名= t2.姓名 union select t1.姓名,t1.工资,t2.奖金 from [工资] t2 on t1.姓名= t2.姓名
之前我们知道union all 将会将两个表的数据全部显示出来,而union则会将相同的字段合并,左外连接,右外连接,union共同使用达成全外连接的效果。
全外连接效果 -
外连接与合并总和运用
多表连接
想要将几个表的数据统一核算,需要借助数据透视表。
- select t1.编号,姓名,部门,基础工资, 0 as 奖金,0 as 扣款 from [资料] t2 on t1.编号 = t2.编号 union select t1.编号,姓名,部门, 0 as 基础工资, 奖金,0 as 扣款 from [资料] t2 on t1.编号=t2.编号 union select t1.编号,姓名,部门, 0 as 基础工资,0 as 奖金, 扣款 from [资料] t2 on t1.编号 = t2.编号
数据透视表汇总
最终效果
整体的思路就是首先构造具备相同字段的条件方便用union,
然后将4张表只包含本表字段有值的体现出来,其他字段用0替代,任何数字加0还是本身,最后将几张表合并在一起,用数据透视表的字段计算功能得出结果。
- 整体来说sql语句基础包含:基础语法,取唯一值,排序,比较运算符,逻辑运算符,数学运算符,以及连接符,还有in,like,between and,排名top,分组group by,连接union (all),内连接inner join on,外连接left/right outer join on 以及他们之间的结合运用。