初识PostgreSQL及其执行计划

2017-08-28  本文已影响1183人  贺小七

        PostgreSQL   是一种先进的SQL数据库服务软件,可在大量的平台上运行(比如我们身边数据量非常之大的银行一账通系统、商城系统),且是一款支持大量平台的高级SQL数据服务软件。PostgreSQL最大的优势是完全开源,允许免费使用修改,甚至任何方式发布,也就是不需要向任何人付任何费用或版税。因此PG已经被很多的应该程序包所使用,许多Linux发行版已经把PostgreSQL作为它的基础安装,或者包含在了安装盘中。

那么PostgreSQL优势又有哪些?

    稳定性强,SQL标准支持较好

    支持PL/pgSQL等多种过程语言

    支持视图、分析函数、CTE等高级特性

    OLAP性能超过MySQL

    占用空间小,vacuum方便整理无用的历史数据

    高并发读写,负载下,PG性能指标较MySQL稳定

    基于函数、条件以及cost的SQL优化,易于调优

    已有访问Mysql、Redis、文本等外部数据源插件

    支持快照增量备份,支持快速rollback

    执行计划共享


获取PostgreSQL

下载源码或用于各种操作系统的二进制包:https://www.postgresql.org/download/

网上针对不同环境下如何安装PG数据都有详细的教程,这里提供几个链接供参考:

Linux:http://www.cnblogs.com/qiyebao/p/4562557.html

MacOS:http://www.cnblogs.com/shineqiujuan/p/4703304.html

Windows:http://blog.chinaunix.net/uid-354915-id-3498734.html

目前远程连接PostgreSQL图形化工具已有一系列可选工具,下面两款是最流行的:

pgAdmin3

phpPgAdmin

以下简单介绍pgAdmin3客户端应用程序,其工作原理是用来发送SQL到PostgreSQL,并快速和简单地显示结果。以1.22.1版本为栗

当首次启东pgAdmin时,会提示注册服务,如下图,填写完成服务器信息后点击【确定】即可登录pgAdmin主界面。

其命令与ORACLE基本相似,以下列举几个常用的。

pgAdmin还有一个优势就是自带查看执行计划工具,那么如何快速查看PostgreSQL的执行计划?

进入pgAdmin中,点击工具栏按钮进入sql窗口,如图

输入查询语句,

select tablename from pg_tables;

快捷键F7即可看到语句的执行计划。

下面简单介绍一下执行计划结果各字段含义:

1、 Cost

cost是比较重要的指标,比如第二个例子中的cost=0.42..8.44有两个部分,启动时间(startup)=0.42ms 和总时间(total)=8.44ms。其中启东时间是执行到返回第一行时需要的cost值,且都是预测值。

2、 Rows

预测的行数。与实际的行数可能有出入,经常vacuum或者analyze的话,这个值和实际值将更加接近。

3、 Width

查询结果的所有字段的总宽度。这个参数并不是关键指标。

与执行计划相关的几个参数:

代价因子relpages为磁盘页,reltuples是行数,一般比与实际值略小,因为relpages,reltuples数据不是实时更新的,一般在vacuum analyze和少部分DDL(如建立索引)后更新。

例如:suborder_info行数实际为798079,但查询的reltuples结果却为792691

一个普通的查询所有记录的语句,具体执行的时候,首先要读取磁盘页面,然后是把每一条记录取出来。没有索引、排序、分组、循环等多余的运算,所以其计划类型为Seq Scan,代价计算公式为:

relpages * seq_page_cost + reltuples * cpu_tuple_cost =16472*1+792691*0.01=24398.91

因为relpages,reltuples数据不是实时更新的,导致计算结果存在一定的差异。但在分析是否有调优空间时,这点差距并不影响我们的判断结果。

Explain Analyze可查看实际执行时候的执行计划,

#Explain Analyze select * from suborder_info where sub_order_no=’20170616013062821’;

loops:循环的次数。

Planning time:计划时间

Execution time:执行时间

查看执行计划,一般我们会关注消耗值cost和扫描的方式,如走索引或者full scan全表扫描。当COST值消耗比较大时需要注意是否有优化的可能,并进一步调试。

另附explain命令可带参数:

-analyze:执行命令并显示执行事件,默认false

-verbose:对执行计划提供额外的信息,如查询字段信息等,默认false

-costs:显示执行计划的,默认true

-buffers:默认false,前置条件是analyze

-format:默认格式是text

上一篇下一篇

猜你喜欢

热点阅读