Facebook查询引擎Presto 介绍与应用

2019-09-23  本文已影响0人  虫儿飞ZLEI

官方说明:

Presto是一种分布式SQL查询引擎,旨在查询分布在一个或多个异构数据源上的大型数据集。

与XSQL和moonbox都有类似的功能

1. 安装部署

1.1 下载安装包

下载地址:
https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.225/presto-server-0.225.tar.gz

解压后的文件目录

1.2 修改配置文件

在etc下修改config.properties(Presto 服务配置)

coordinator=true
node-scheduler.include-coordinator=true
http-server.http.port=8099
query.max-memory=10GB
query.max-memory-per-node=1GB
discovery-server.enabled=true
discovery.uri=http://centos4:8099

ps: 如果是单节点部署,那么node-scheduler.include-coordinator=true,指定这个节点即作为coordinator,也作为worker。

在etc下修改node.properties(包含针对于每个节点的特定的配置信息)

node.environment=production
node.id=centos4-node-main-0001
node.data-dir=/var/presto/data

在etc下修改jvm.config

-server
-Xmx60G
-Xms4G
-Xmn2g
-Xss512k
-XX:+UseG1GC
-XX:G1HeapRegionSize=32M
-XX:ParallelGCThreads=20
-XX:+UseGCOverheadLimit
-XX:+ExplicitGCInvokesConcurrent
-XX:+HeapDumpOnOutOfMemoryError
-XX:+ExitOnOutOfMemoryError
-Djava.library.path=/opt/cloudera/parcels/CDH/lib/hadoop/lib/native

1.3 配置数据源

presto可以接入多种数据源,以hive和mysql为例

接入hive数据源:
在etc/catalog目录下创建hive.properties文件

connector.name=hive-hadoop2
hive.metastore.uri=thrift://centos4:9083

接入mysql数据源:
在etc/catalog目录下创建mysql.properties文件

connector.name=mysql
connection-url=jdbc:mysql://ip:3306
connection-user=username
connection-password=password

2. 启动和停止命令

2.1 后台启动

bin/launcher start

2.2 前台启动

bin/launcher run

2.3 停止服务

bin/laucher stop

3. 启动测试

bin/launcher start

3.1 页面

启动成功后可以在web端看到ui界面,访问coordinator节点的discovery.uri地址,可以看到如下界面:


3.2 命令行查询数据

3.2.1 下载可执行的jar包

下载地址:https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.225/presto-cli-0.225-executable.jar

重命名为presto,并赋予可执行权限chmod +x

3.2.2 运行jar包

./presto --server centos4:18099
image.png

3.2.3 查询命令

说明,presto用catalog表示数据源,用schemas表示数据库

在ui页面也可以看到查询记录


3.3 jdbc代码连接

<dependency>
    <groupId>com.facebook.presto</groupId>
    <artifactId>presto-jdbc</artifactId>
    <version>0.225</version>
</dependency>

这三种形式都可以

jdbc:presto://host:port
jdbc:presto://host:port/catalog
jdbc:presto://host:port/catalog/schema

可以像连接jdbc一样连接

// URL parameters
String url = "jdbc:presto://example.net:8080/hive/sales";
Properties properties = new Properties();
properties.setProperty("user", "test");
properties.setProperty("password", "secret");
properties.setProperty("SSL", "true");
Connection connection = DriverManager.getConnection(url, properties);

// properties
String url = "jdbc:presto://example.net:8080/hive/sales?user=test&password=secret&SSL=true";
Connection connection = DriverManager.getConnection(url);

4. 后话

官方文档:https://prestodb.github.io/docs/current/index.html
参考文档:https://blog.csdn.net/zyj8170/article/details/60954885

上一篇下一篇

猜你喜欢

热点阅读