[实战] 用数人云,部署弹性 ELK 集群就五步
摘要:本篇文章介绍了如何通过数人云部署一套标准的 ELK 日志收集系统。第一步,将主机组织成集群;第二步,发布 ElasticSearch 实例;第三步,发布 Kibana 实例;第四步,发布 Logstash 实例到待收集日志的应用 server ;第五步,快速扩展/减少 ElasticSearch , Kibana 实例数(可选)。
在具体介绍部署步骤前,让我们先来了解下 ELK 是什么。 ELK 是 ElasticSearch+Logstash+Kibana 的缩写, ElasticSearch 是一款基于 Lucene 的分布式搜索引擎,大名鼎鼎的 GitHub 就是由它提供的搜索。 Logstash 是一款分布式日志收集系统,是一个应用程序日志、事件的传输、处理、管理和搜索的平台,可以用来统一对应用程序日志进行收集管理,提供 Web 接口用于查询和统计。 Kibana 是一个基于浏览器页面的 ElasticSearch 前端展示工具,内置了各种查询和聚合操作,并拥有图形化展示功能。
我们知道,日志记录了各种重要信息,如应用程序的 log 记录的 error,warn 级别的 log,在量小的情况下,我们当然可以直接 vi+awk+sed+grep 定位原因,而当数量非常大,且需要各种聚合或基于多个异常关键词的组合搜索时,就是 ELK 大显身手的地方!可以说, ELK 是运维界的明星,非常适合应用级的实时监控和核心服务预警。
下面就让我们来看看如何通过数人云部署一套标准的 ELK 日志收集系统吧。
第一步, 将主机组织成集群
首先,需要访问 数人云 注册并登录系统,然后进入主机的准备工作。假设有7台主机,这些主机可以是连接互联网的私有主机,也可以是阿里云、Ucloud、 AWS、Azure、首都在线、华为云等公有云上购买的任意一台云主机。这7台主机之间需要网络互通并能够访问外网。7台主机的规划及配置信息如下:
1.jpg然后,登录账户,在集群管理中,点击创建群组,填写集群名称( elk ),选择 3 Master 集群,点击完成。 添加主机后,如图点击右上角下拉菜单,选择添加主机。
2.jpg点击已有主机下面的按钮 Ubuntu 或者 CentOS ,填写主机名称,并在主机上根据"连接主机"的提示进行操作。
选择主机组件:前 3 台主机( 10.3.10.9 [1-3] )为 Master 节点, 无可选组件;在添加主机 10.3.10.94 时需要将可选组件中的内部代理勾选上。
3.jpg登录到将要添加的主机终端
`ssh ubuntu@10.3.10.91 `
安装 Docker (若主机已安装 Docker ,这步可跳过)
`curl -sSL https://get.docker.com/ | sh `
安装 Agent :点击页面按钮,点击“生成命令”生成安装命令并粘贴到主机终端运行。
`sudo -H OMEGA_ENV=prod bash -c "$(curl -Ls https://raw.githubusercontent.com/Dataman-Cloud/agent-installer/master/install-agent.sh)" -s 92a0c8b287d34445b03f8518ce688e66 `
按提示执行以上两步后,点击"完成"即成功添加主机。
需要注意的是,由于数人云默认将加入集群的前3台机器作为 master 节点,为了符合前期规划,请确保主机10.3.10.91, 10.3.10.92, 10.3.10.93 首先被加入到集群中。同时,向同一集群添加的主机应存在于同一网段内,暂不支持跨公网的主机组建集群。此外,由于数人云在主机连接后会向主机上安装基础服务,所以主机需要一段时间进行初始化,依主机所处的网络环境,主机初始化的时间有所不同。
主机添加完成后,检查主机运行是否正常,如图:
4.jpg第二步,发布 ElasticSearch 实例
我们将通过数人云将 ES 的 Docker 镜像以 HOST 模式部署到我们规划的主机 10.3.10.95 和 10.3.10.96 上。具体操作如下:
选择"应用管理"中的"新建应用",如图:
5.jpg新建 ES 应用:
-
填写应用名称: es
-
选择集群:elk
-
添加应用镜像地址:index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5
-
填写镜像版本:2015112811
-
网络模式:HOST 模式
-
主机选择:10.3.10.95,10.3.10.96
-
容器目录:容器内的挂载目录 /data/app/elasticsearch
-
主机目录:主机上的挂载目录 /data (该目录是我们主机数据盘所在的目录)
-
选择容器规格: CPU:0.8 内存:4096MB
-
容器个数:2 并且勾选 1 容器: 1 主机
-
高级设置:
-
添加应用地址:
-
应用端口: 9200
-
类型: 对内
-
协议: TCP
-
地址: 10.3.10.94:9998
-
-
环境变量
-
Key: CLUSTERNAME
-
Value: dataman-es
-
-
环境变量
-
Key: ZOOKEEPER_ADDRESS
-
Value: 10.3.10.91:2181,10.3.10.92:2181,10.3.10.93:2181
-
-
填写完成后,点击创建。 如图:
6.png 7.png第一次向集群部署 ES 时由于本地没有 Docker 镜像 index.shurenyun.com/dataman/jdk7-elasticsearch-1.4.5,集群需要大约 1-2 分钟去拉取镜像(可能更长时间)。我们可以在 ES 的应用详情页看到相应的状态,以及事件等。
第三步, 发布 Kibana 实例
点击新建应用,新建 Kibana 应用:
-
填写应用名称: kibana
-
选择集群:elk
-
添加应用镜像地址:index.shurenyun.com/dataman/kibana
-
填写镜像版本:4.1.4
-
网络模式:网桥模式
-
选择主机: ALL
-
容器规格: CPU:0.2 内存:256 MB
-
容器个数:1
-
高级设置:
-
应用地址:
-
应用端口: 5601
-
类型: 对内
-
协议: HTTP
-
地址: http://10.3.10.94:5601
-
-
环境变量:
-
KEY: ELASTICSEARCH_URL
-
VALUE: http://10.3.10.94:9998
-
-
注:Kibana 需要通过环境变量 ELASTICSEARCH_URL 来确定 ElasticSearch 的地址,由于添加主机时我们已经设置内部代理的节点为10.3.10.94,并且在添加 ES 应用时将其端口映射到了内部代理端口 9998 , 所以这里我们只需要设置 ELASTICSEARCH_URL=http://10.3.10.94:9998 即可使得 Kibana 发现 ES 实例。
来到 Kibana 的应用详情页,若应用状态为运行中即应用已正常运行。
8.png打开浏览器,访问地址:http://10.3.10.94:5601(可能需要为你的浏览器设置内网代理),看到如下页面,则说明 kibana 应用已经成功运行。
9.png第四步, 发布 Logstash 实例到待收集日志的应用 server
点击新建应用,新建 Logstash 应用:
-
填写应用名称: logstash
-
选择集群:elk
-
添加应用镜像地址:index.shurenyun.com/dataman/logstash
-
填写镜像版本:2.1
-
网络模式:网桥模式
-
选择主机: 10.3.10.97
注:由于上面我们假设应用运行在了主机 10.3.10.97 上,所以这里我们限制 Logstash 在该主机上收集日志
-
主机/容器目录
-
数据挂载目录: /var/log/app
-
容器目录: /var/log/app
-
注: 这里我们假设用户的应用(待采集日志的应用)日志存储在了主机目录 /var/log/app 下面。
-
容器规格: CPU:0.3 内存:256 MB
-
容器个数:1
-
高级设置:
CMD:
`logstash -e 'input { file { type => "linux-syslog" path => ["/var/log/app/*.log"]}} output { elasticsearch { hosts => "10.3.10.94:9998" }}'`
同样,等待 1-2 分钟后 Logstash 将被部署到应用 server 上并且开始收集日志, 用户可以通过访问 Kibana 的页面来发掘相应的日志信息。
第五步, 快速扩展/减少 ElasticSearch, Kibana 实例数(可选)
为了提高集群的资源利用率,我们可能需要根据负载来扩展或者减少 ElasticSearch , Kibana 等的实例数,在数人云的应用列表页或者应用详情页, 点击扩展按钮,即可快速调整相应应用的实例数。
通过前面的五步实战,大家都尝试了用数人云去部署 ELK 系统,总结来说,使用数人云去部署 ELK 主要有三大优势:第一,部署方便: 用户的应用无需任何改造,只需要提供日志的存储目录;第二,可扩展: 如果日志存储端( ElasticSearch )需要添加更多的实例, 用户只需要向集群中添加更多的机器, 并在应用列表页点击扩展相应的 ELK 即可;第三,安全: 用户应用的所有日志数据都存储在了集群内网的 ES 服务集群中。