FLINK SQL 数据打宽

2021-11-01  本文已影响0人  貌似很有道理呢

Regular Join

Interval Join

Temporal join(时态表打宽)

SELECT * FROM FACT [LEFT] JOIN DIM FOR SYSTEM_TIME AS OF FACT.{PEOCTIME|ROWTIME} ON FACT.ID = DIM.ID,即用FACT.{PEOCTIME|ROWTIME}时间去取DIM维表中的某一个版本与FACT事实表join ,只有左流才会触发结果更新

1. lookup DB
2. changelog版本表
3. hive分区表
Hive最新分区 Hive最新表
stream读,每次读一个分区 按batch读,每次读全部分区
streaming-source.partition-include取latest streaming-source.partition-include取all
通过streaming-source.monitor-interval发现分区 lookup.join.cache.ttl控制reload时间

UTDF

-自定义打宽

上一篇下一篇

猜你喜欢

热点阅读