您好,欢迎来到聚文网。 登录 免费注册
ETL数据整合与处理(Kettle)

ETL数据整合与处理(Kettle)

  • 字数: 323000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 出版日期: 2021-03-01
  • 商品条码: 9787115552204
  • 版次: 1
  • 开本: 16开
  • 页数: 228
  • 出版年份: 2021
定价:¥49.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,最后落实在任务实现环节。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握ETL数据整合与处理相关技能。
内容简介
本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL;第7章介绍了Kettle工具任务的相关组件,能够帮助读者串联不同的任务,以及实现调度的功能;第8章介绍了无人售货机ETL项目,通过项目案例的形式,帮助读者将所学知识融会贯通。本书可以作为高校数据科学或数据分析相关专业的教材,也可作为ETL爱好者的自学用书。
目录
第1章开启ETL之旅
任务1.1认识ETL
1.1.1了解ETL
1.1.2选择ETL工具
任务1.2配置Kettle运行环境
1.2.1安装JDK
1.2.2安装MySQL数据库
1.2.3配置Kettle
任务1.3熟悉Kettle基本操作
1.3.1认识Kettle界面
1.3.2新建转换与任务
1.3.3运行与查看结果面板
小结
课后习题
第2章源数据获取
任务2.1创建数据库连接
2.1.1建立数据库连接
2.1.2设置参数
2.1.3测试和浏览数据库连接结果
2.1.4建立/停止共享数据库连接
任务2.2表输入
2.2.1建立表输入转换工程
2.2.2设置参数
2.2.3预览结果数据
任务2.3CSV文件输入
2.3.1建立CSV文件输入转换工程
2.3.2设置参数
2.3.3预览结果数据
任务2.4Excel输入
2.4.1建立Excel输入转换工程
2.4.2设置参数
2.4.3预览结果数据
任务2.5生成记录
2.5.1建立生成记录转换工程
2.5.2设置参数
2.5.3预览结果数据
任务2.6生成随机数
2.6.1建立生成随机数转换工程
2.6.2设置参数
2.6.3预览结果数据
任务2.7获取系统信息
2.7.1建立获取系统信息转换工程
2.7.2设置参数
2.7.3预览结果数据
小结
课后习题
第3章记录处理
任务3.1排序记录
3.1.1建立排序记录转换工程
3.1.2设置参数
3.1.3预览结果数据
任务3.2去除重复记录
3.2.1建立去除重复记录转换工程
3.2.2设置参数
3.2.3预览结果数据
任务3.3替换NULL值
3.3.1建立替换NULL值转换工程
3.3.2设置参数
3.3.3预览结果数据
任务3.4过滤记录
……
第4章字段处理
第5章高级转换
第6章迁移和装载
第7章任务
第8章无人售货机项目实战

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网