kettle

发布时间 2023-06-16 15:31:49作者: 皖医小生

1、简介

Kettle最早是一个开源的ETL(Extract-Transform-Load的缩写)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。后来Kettle重命名为Pentaho Data Integration 。
它由Java开发,支持跨平台运行,其特性包括:支持100%无编码、拖拽方式开发ETL数据管道;可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;支持ETL数据管道加入机器学习算法。
Kettle是一个实现ETL开发的一款开发工具,Spoon是Kettle工具提供的图形化界面。

2、安装jdk,主流的1.8版本的

3、官网下载方式

第一种方式

1)kettle中文网http://www.kettle.org.cn/download

2)点击后会跳到官网,不过下载地址换了,切换打summary,点击链接会跳到下载地址。

3)选择需要的版本下载  pdi-ce-8.3.0.0-371.zip   Pentaho Data Integration (Base Install)

第二种方式

官网https://sourceforge.net/

搜索Pentaho Data Integration找到第一个Pentaho from Hitachi Vantara

直达下载地址 https://www.hitachivantara.com/en-us/products/pentaho-platform/data-integration-analytics/pentaho-community-edition.html

 

 

 

4、使用

因为Kettle是纯java编写,所以启动前要先预装JDK并配置环境变量。
Windows下双击Spoon.bat文件运行Kettle,打开spoon图形工具。

目录下需要放入相应数据库的jar文件 pdi-ce-9.4.0.0-343\data-integration\lib\mysql-connector-java-8.0.16.jar

例如mysql的数据库

双击Spoon.bat文件运行程序

 

进行数据库连接

这里是mysql数据库

建立连接的两种方式
第一种方式:数据库连接类型选择Generic Database
自定义连接URL填入:
jdbc:mysql://192.168.173.100:3306/test?serverTimezone=GMT%2B8&autoReconnect=true&useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=convertToNull&useSSL=false
(注:192.168.173.100是MySQL服务器地址,3306是MySQL开放端口,test是要连接的数据库名称)
自定义驱动类名称填入:com.mysql.cj.jdbc.Driver
第二种方式:在kettle的安装目录下data-integration\simple-jndi\jdbc.properties加入jdbc的连接信息
MYSQL8_DB/type=javax.sql.DataSource
MYSQL8_DB/driver=com.mysql.cj.jdbc.Driver
MYSQL8_DB/url=jdbc:mysql://192.168.173.100:3306/test?serverTimezone=GMT%2B8&autoReconnect=true&useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=convertToNull&useSSL=false
MYSQL8_DB/user=root解释说明用户名
MYSQL8_DB/password=aaa解释说明密码
连接数据库方式选择mysql连接,连接方式选择JNDI,JNDI名称填写MYSQL8_DB