kubernetes以及运维开发系列

9. InfluxDB 设置数据保留策略,验证保留的数据存储大小

2019-11-30  本文已影响0人  Devops海洋的渔夫

需求

在使用Telegraf+InfluxDB+Grafana监控服务器资源的时候,如果influxdb中的数据不设置超时过期的机制的话,那么数据就会默认一直保存。这样一直保存的话,数据量就会导致偏大。
这时候就要适当调整influxdb的数据存储时长,保留最近一段时间的数据即可。

1.基本概念说明

1.1 InfluxDB 数据保留策略说明

InfluxDB的数据保留策略(RP)用来定义数据在InfluxDB中存放的时间,或者定义保存某个期间的数据。
一个数据库可以有多个保留策略, 但每个策略必须是独一无二的。

1.2 InfluxDB数据保留策略目的

InfluxDB本身不提供数据的删除操作, 因此用来控制数据量的方式就是定义数据保留策略。
因此定义数据保留策略的目的是让InfluxDB能够知道可以丢弃哪些数据, 节省数据存储空间,避免数据冗余的情况。

2.操作示例

2.1 查看数据保留策略

show retention policies on 数据库名

执行如下:

# 选择使用telegraf数据库
> use telegraf;
Using database telegraf
> 
> 
# 查询数据保留策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true
> 

从查询的结果来看,默认只有一个策略,而上面这个策略的说明了什么信息呢?

2.2 新建数据保留策略

# 新建一个策略
CREATE RETENTION POLICY "策略名称" ON 数据库名 DURATION 时长 REPLICATION 副本个数;

# 新建一个策略并且直接设置为默认策略
CREATE RETENTION POLICY "策略名称" ON 数据库名 DURATION 时长 REPLICATION 副本个数 DEFAULT;

下面直接新增一个新的默认策略看看,示例如下:

# 创建新的默认策略之前的策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true
> 
> 
# 创建新的默认策略role_01保留数据时长1小时
> CREATE RETENTION POLICY "role_01" ON telegraf DURATION 1h REPLICATION 1 DEFAULT;
> 
# 查看策略的变化
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        false
role_01 1h0m0s   1h0m0s             1        true
> 

因为默认策略已经修改为role_01,那么如果还想用之前的autogen策略来查询数据,则需要在查询表之前加上策略的名称:"策略名".表名,如下:

> select * from "autogen".cpu limit 2;
name: cpu
time                cpu       host     usage_guest usage_guest_nice usage_idle        usage_iowait        usage_irq usage_nice usage_softirq usage_steal usage_system        usage_user
----                ---       ----     ----------- ---------------- ----------        ------------        --------- ---------- ------------- ----------- ------------        ----------
1574663960000000000 cpu-total locust03 0           0                99.44972486076016 0.05002501250678571 0         0          0             0           0.2501250625248291  0.2501250625430281
1574663960000000000 cpu0      locust03 0           0                99.59959959921699 0.10010010010243535 0         0          0             0           0.20020020020031867 0.10010010005008706
> 

2.3 修改数据保留策略

ALTER RETENTION POLICY "策略名称" ON "数据库名" DURATION 时长

ALTER RETENTION POLICY "策略名称" ON "数据库名" DURATION 时长 DEFAULT

在这里示例修改role_01策略的时长为2h,如下:

> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        false
role_01 1h0m0s   1h0m0s             1        true
> 
> 
# 执行修改时长为2小时
> ALTER RETENTION POLICY "role_01" ON "telegraf" DURATION 2h
> 
# 可以看到role_01的duration为2h
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        false
role_01 2h0m0s   1h0m0s             1        true
> 

2.4 删除数据保留策略

drop retention POLICY "策略名" ON "数据库名"

示例删除role_01策略,如下:

# 查看当前的数据保留策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        false
role_01 2h0m0s   1h0m0s             1        true
> 
# 删除role_01的策略
> drop retention POLICY "role_01" ON "telegraf"
> 
# 查看删除后的策略,可以看到剩余的策略autogen并不会自动设置为默认default策略
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        false
> 
# 修改autogen策略为default策略
> ALTER RETENTION POLICY "autogen" ON "telegraf"  DEFAULT
> 
> show retention policies on telegraf
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true
> 

3. 验证变更策略之后,存储数据是否会变少

默认的telegraf数据库的存储策略是一直保存数据,并无限制。那么为了节省数据存储,我下面创建一个保留1小时的策略,然后删除默认的策略,观察存储数据是否变少。

3.1 变更策略之前的数据存储大小

在变更策略之前,我特意运行了采集数据服务几天,查看目前的存储数据大小如下:

[root@server influxdb]# du -h --max-depth=1 .
69M ./data
69M .
[root@server influxdb]# 

可以看到有69M的存储数据。

3.2 创建新策略,删除旧策略

# 创建新策略
> CREATE RETENTION POLICY "rule_telegraf" ON telegraf DURATION 1h REPLICATION 1 DEFAULT;
> 
> show retention policies on telegraf
name          duration shardGroupDuration replicaN default
----          -------- ------------------ -------- -------
autogen       0s       168h0m0s           1        false
rule_telegraf 1h0m0s   1h0m0s             1        true
> 
# 删除历史策略
> drop retention POLICY "autogen" ON "telegraf";
> 
# 查看当前的数据策略
> show retention policies on telegraf
name          duration shardGroupDuration replicaN default
----          -------- ------------------ -------- -------
rule_telegraf 1h0m0s   1h0m0s             1        true
> 

3.3 删除旧策略之后,确认数据存储大小

# 删除旧策略之前,数据有69M
[root@server influxdb]# du -h --max-depth=1 .
69M ./data
69M .
[root@server influxdb]# 
# 删除旧策略之后,数据只保留15M
[root@server influxdb]# du -h --max-depth=1 .
15M ./data
15M .
[root@server influxdb]# 

从上面的结果来看,只需要配置管理数据保留策略,就可以控制好数据的存储空间。

上一篇下一篇

猜你喜欢

热点阅读