第1章 ClickHouse概述
2021-07-27 本文已影响0人
码农GG
1.1 什么是ClickHouse
ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。
1.2 什么是列式存储
以下面的表为例:
image.png
采用行式存储时,数据在磁盘上的组织结构为:
image.png好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。
而采用列式存储时,数据在磁盘上的组织结构为:
这时想查所有人的年龄只需把年龄那一列拿出来就可以了
1.3 安装前的准备
1.3.1 CentOS取消打开文件数限制
在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入一下内容:
[root@hadoop102 software]# vim /etc/security/limits.conf
在文件末尾添加:
最大文件数
* soft nofile 65536
* hard nofile 65536
最大进程数
* soft nproc 131072
* hard nproc 131072
[root@hadoop102 software]# vim /etc/security/limits.d/90-nproc.conf
在文件末尾添加:
* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072
重启服务器之后生效,用ulimit -n 或者ulimit -a查看设置结果
[root@hadoop102 ~]# ulimit -n
65536
1.3.2 CentOS取消SELINUX
修改/etc/selinux/config中的SELINUX=disabled后重启
[root@hadoop102 ~]# vim /etc/selinux/config
SELINUX=disabled
1.3.3 关闭防火墙
[root@hadoop102 ~]# service iptables stop
[root@hadoop102 ~]# service ip6tables stop
ip6tables:将 chains 设置为 ACCEPT 策略:filter [确定]
ip6tables:清除防火墙规则: [确定]
:正在卸载模块: [确定]
1.3.4 安装依赖
[root@hadoop102 ~]# yum install -y libtool
[root@hadoop102 ~]# yum install -y *unixODBC*