第1章 ClickHouse概述

2021-07-27  本文已影响0人  码农GG

1.1 什么是ClickHouse

ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。

1.2 什么是列式存储

以下面的表为例:


image.png

采用行式存储时,数据在磁盘上的组织结构为:

image.png

好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。
而采用列式存储时,数据在磁盘上的组织结构为:

image.png

这时想查所有人的年龄只需把年龄那一列拿出来就可以了

1.3 安装前的准备

1.3.1 CentOS取消打开文件数限制

在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入一下内容:

[root@hadoop102 software]# vim /etc/security/limits.conf
在文件末尾添加:
最大文件数
* soft nofile 65536 
* hard nofile 65536 
最大进程数
* soft nproc 131072 
* hard nproc 131072

[root@hadoop102 software]# vim /etc/security/limits.d/90-nproc.conf
在文件末尾添加:
* soft nofile 65536 
* hard nofile 65536 
* soft nproc 131072 
* hard nproc 131072

重启服务器之后生效,用ulimit -n 或者ulimit -a查看设置结果

[root@hadoop102 ~]# ulimit -n
65536

1.3.2 CentOS取消SELINUX

修改/etc/selinux/config中的SELINUX=disabled后重启
[root@hadoop102 ~]# vim /etc/selinux/config
SELINUX=disabled

1.3.3 关闭防火墙

[root@hadoop102 ~]# service iptables stop 
[root@hadoop102 ~]# service ip6tables stop
ip6tables:将 chains 设置为 ACCEPT 策略:filter            [确定]
ip6tables:清除防火墙规则:                                [确定]
:正在卸载模块:                                           [确定]

1.3.4 安装依赖

[root@hadoop102 ~]# yum install -y libtool
[root@hadoop102 ~]# yum install -y *unixODBC*
上一篇下一篇

猜你喜欢

热点阅读