大数据玩转大数据工具癖

ketlle windows下的安装

2019-01-30  本文已影响2人  利伊奥克儿

ketlle基本介绍

kettle是纯java开发,开源的etl工具。可以在Linux、windows、unix中运行。有图形界面,也有命令脚本还可以二次开发。
kettle其实是以前的叫法,现在官方称为:PDI(Pentaho Data Integeration)


Pentaho产品是一个用于访问、集成、操作、可视化和分析数据的综合平台。
无论数据存储在平面文件、关系数据库、Hadoop集群、NoSQL数据库、分析数据库、社交媒体流、操作商店还是云中,Pentaho产品都可以帮助您发现、分析和可视化数据,以找到所需的答案——即使您没有编码经验。
具有编程经验的高级用户可以使用API定制报告、查询、转换来扩展功能。

安装前准备

  1. kettle下载
  2. jdk

kettle的安装

JDK安装

kettle是基于java开发的,所以需要java环境


jdk版本选择

这里选择的是64位1.8版本jdk。

jdk的安装(两种方法):

  1. 直接解压jdk的zip文件,然后配置环境变量。
    在很多时候这样没问题,但是有些工具(kettle以外)在调用这种方式的jdk或jre会出现java没起来的情况
  2. 通过.exe安装(建议这么做)然后配置环境变量。
    这样安装完以后,在应用程序能对java进行一些设置。

jdk环境变量配置


JAVA_HOME配置
将java加入path
验证java环境变量配置成功

至此jdk安装完毕

kettle的安装

选择7.1版本的kellte
在这里我们选择7.1版本的kettle
原因是我装过8.0以上的版本,但是在使用资源库的时候老是失败(默认的是admin/admin)
我重新弄一个7.1版本的时候测试是没问题的
下载后的文件如下
pdi-ce-7.1.0.0-12.zip
将文件解压
进入目录
\...\pdi-ce-7.1.0.0-12\data-integration
window下执行这个命令
启动后的页面

可能需要的步骤

  1. 如果在etl过程中用到了数据库的相关资源
    则需要把相关的数据库的链接驱动添加到\...\pdi-ce-7.1.0.0-12\data-integration\lib
    比如mysql的链接驱动
    添加mysql连接驱动
    然后重新启动spoon.bat即可

到目前为止,kettle最基本的环境搭建,就结束了。
此处只是最基本的环境搭建,关于linux下的搭建和工具的使用后续后持续记录。

注:此为本人工作学习记录,转载请注明出处!!!

上一篇下一篇

猜你喜欢

热点阅读