Java的第三开源库程序员Java学习笔记

Kettle 工具的简单使用

2017-07-17  本文已影响159人  食尘者

概述

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。


使用示例

创建转换

目标数据源"target"配置同下,配置完后可点击下方的测试按钮进行数据库连接可用性检查。

来源数据源配置 来源和目标数据源连接
全量同步

先删除后插入,清除目标表所有旧数据,再重新插入最新的数据,适合数据量较少的数据。

清空目标表旧数据
按时间戳同步

需要分表创建以下两个转换:
1、根据记录的删除日志表,删除废弃数据。
2、选定时间戳字段(比如最后修改时间),比较时间戳,判断进行操作:插入新增数据、更新修改数据。

1、删除废弃数据
获取已删除的最大流水号 获取待删除数据标识
2、根据时间戳同步数据
数据同步

根据比较来源和目标数据字段(来源和目标表结构及字段名一致),判断进行操作:删除不存在的旧数据、插入新增数据、更新修改数据,用于数据量不大的情况。
注意:用于合并的两个数据输入流,必须按照相同的主键按照相同的方向进行排序,否则合并出来的数据标志字段的取值是错误的。

数据同步-1 数据同步-2
上一篇下一篇

猜你喜欢

热点阅读