第5章 高级转换 教案
课程名称:ETL数据整合和处理
课程类别:必修
适用专业:大数据技术类相关专业
总学时:64学时(其中理论30学时,实验34学时)
总学分:4.0学分
本章学时:10学时
一、 材料清单
(1) 《ETL数据整合和处理(Kettle)》教材。
(2) 引导性提问。
(3) 探究性问题。
(4) 拓展性问题。
二、 教学目标与基本要求
1. 教学目标
讲授记录集连接、多路数据合并连接、单变量统计、公式、利用Janino计算Java表达式、JavaScript代码、设置变量和获取变量等高级转换组件,进行复杂的数据转换处理的方法和操作,让学生达到以下教学目标:
(1) 了解高级转换常用组件的作用。
(2) 掌握高级转换常用组件的参数及参数的设置方法。
(3) 熟悉使用高级转换常用组件后的结果数据解读。
2. 基本要求
(1) 掌握进行复杂数据处理的高级转换组件和参数设置。
(2) 掌握浏览高级转换组件执行结果和出错处理的方法。
三、 问题
1. 引导性提问
引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。
(1) 高级转换与字段处理、记录处理有什么不同?
(2) 高级转换的参数设置是否十分复杂?
(3) 高级转换组件是否可以代替常用的字段处理、记录处理中的组件?
(4) 多路数据合并为什么比记录集连接改为高效、快速?
(5) 单变量统计能否对多个字段进行计算?
2. 探究性问题
探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。
(1) 记录集连接要根据什么来进行数据连接?
(2) 多路数据合并连接在什么场景下使用?
(3) 利用janineo计算Java表达式、JavaScript代码组件中,哪一个需要编写脚本?
(4) 单变量统计会产生新字段吗?
(5) 单变量统计与公式的计算有什么不同?
(6) 公式和利用janineo计算Java表达式的计算有什么相同和不同点?
(7) 为什么要设置变量?
(8) 获取变量前需要设置什么?
3. 拓展性问题
拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完成拓展性的问题。
(1) 记录集连接为什么要进行记录排序?
(2) 公式和利用janineo计算Java表达式两种计算方法,它们是否可以互为代替进行计算?
(3) 计算器组件计算3个以上字段的数据该如何处理?
(4) 设置变量、获取变量在什么场景下使用?
四、 主要知识点、重点与难点
1. 主要知识点
记录集连接、多路数据合并连接、单变量统计、公式、利用janineo计算Java表达式、JavaScript代码、设置变量、获取变量等组件的参数设置和使用。
2. 重点
记录集连接、多路数据合并连接、单变量统计、公式、利用janineo计算Java表达式、JavaScript代码、设置变量、获取变量等组件的应用场景和操作。
3. 难点
(1) 记录集连接、多路数据合并连接、单变量统计、公式、利用janineo计算Java表达式、JavaScript代码、设置变量、获取变量等组件的参数设置和不同之处。
(2) JavaScript代码组件的参数设置
(3) 设置变量、获取变量的场景应用
五、 教学过程设计
1. 理论教学过程
(1) 记录集连接组件及其参数设置。
(2) 多路数据合并连接组件及其参数设置。
(3) 单变量统计组件及其参数设置。
(4) 公式组件及其参数设置。
(5) 利用janineo计算Java表达式组件及其参数设置。
(6) JavaScript代码组件及其参数设置。
(7) 设置变量组件及其参数设置。
(8) 获取变量组件及其参数设置。
2. 实验教学过程
(1) 建立转换工程和记录集连接等组件,设置组件参数,运行和预览数据。
(2) 建立转换工程和多路数据合并连接等组件,设置组件参数,运行和预览数据。
(3) 建立转换工程和单变量统计等组件,设置组件参数,运行和预览数据。
(4) 建立转换工程和公式等组件,设置组件参数,运行和预览数据。
(5) 建立转换工程和利用janineo计算Java表达式等组件,设置组件参数,运行和预览数据。
(6) 建立转换工程和JavaScript代码等组件,设置组件参数,运行和预览数据。
(7) 建立转换工程和设置变量等组件,设置组件参数,运行和预览数据。
(8) 建立转换工程和获取变量等组件,设置组件参数,运行和预览数据。
六、 教材与参考资料
1. 教材
2. 参考资料
因篇幅问题不能全部显示,请点此查看更多更全内容