Kettle - 核心概念

发布时间 2023-06-09 22:39:29作者: HOUHUILIN

 

可视化编程

转换

 

 

 

 

可视化编程

kettle 可以被归类为可视化编程语言Visula Programming Languages,VPL),因为 Kettle可以使用图形化的方式定义复杂的ETL程序工作流

可视化编程一直是 Kettle 里的核心概念,它可以让你快速构建复杂的ETL作业减低维护工作量。它通过隐藏很多技术细节,使IT领域更贴近于商务领域。

kettle里的代码就是转换作业

 

 

转换

转换(transformation)负责数据的输入、转换、校验和输出等工作。Kettle中使用转换完成数据ETL全部工作。转换由多个步骤(Step)组成,如文本文件输入,过滤输出行,执行SQL脚本等。各个步骤使用(Hop)来链接。跳定义了一个数据流通道,即数据由一个步骤流(跳)向下一个步骤。在Kettle中数据的最小单位是数据(row),数据流中流动的其实是缓存的行集(RowSet)

 

 

 

 

 

 

 

 

 

 

— EOF —