ClickHouse

ClickHouse物化视图丢数据问题排查

2021-07-16  本文已影响0人  淡淡的小番茄

背景

在ClickHouse中,物化视图一般起到数据的预处理(聚合)的作用,可以理解为是对原表的insert动作,定义额外的执行处理逻辑。相当于触发器的功能。

我们目前的部署方式是,1分片1副本,只有两台机器。物化视图及kafka引擎表都是建在其中一台上。

Kafka------->Kafka引擎表----------->物化视图(1)-------->ODS事实表----------->物化视图(2)----------------->统一的事实表

出现的问题

目前出现的问题是:ods部分数据,在统一的事实表中不存在,存在数据丢失。

排查步骤

首先想到的是,物化视图(2)出现问题,查看是否出现异常。

1、查看clickhouse日志

ERROR日志中未见明显异常。

INFO日志中相关的日志如下:

看到这日志基本就定位出来问题了。我们topic默认是10个分区,此处kafka消费者信息提示只是消费:5,6,7,8,9这5个分区。推测同分组下还有别的消费者。

2、查看kafka topic的分组消费情况

发现同组下确实是有别的消费者。

结论

两个节点都部署了kafka引擎表及物化视图(1),但是物化视图(2)只有在一台机器上有部署。导致部分数据丢失,没有直接到统一的事实表中。

上一篇 下一篇

猜你喜欢

热点阅读