可视化编程
kettle 可以被归类为可视化编程语言(
Visula Programming Languages
,VPL),因为 Kettle可以使用图形化的方式定义复杂的ETL程序和工作流。可视化编程一直是 Kettle 里的核心概念,它可以让你快速构建复杂的ETL作业和减低维护工作量。它通过隐藏很多技术细节,使IT领域更贴近于商务领域。
kettle里的代码就是转换和作业。
转换
转换(
transformation
)负责数据的输入、转换、校验和输出等工作。Kettle中使用转换完成数据ETL全部工作。转换由多个步骤(Step)组成,如文本文件输入,过滤输出行,执行SQL脚本等。各个步骤使用跳(Hop)来链接。跳定义了一个数据流通道,即数据由一个步骤流(跳)向下一个步骤。在Kettle中数据的最小单位是数据行(row),数据流中流动的其实是缓存的行集(RowSet)。
— EOF —