您好,欢迎来到聚文网。 登录 免费注册
数据清洗(第2版大数据类专业规划教材)/大数据技术与应用丛书

数据清洗(第2版大数据类专业规划教材)/大数据技术与应用丛书

  • 字数: 500
  • 出版社: 清华大学
  • 作者: 编者:黑马程序员|
  • 商品条码: 9787302670292
  • 版次: 2
  • 开本: 16开
  • 页数: 307
  • 出版年份: 2024
  • 印次: 1
定价:¥58 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书以Kettle 9.2为基础 ,全面介绍使用Kettle实现 ETL的相关操作。全书共8 章,分别讲解数据清洗和 ETL的概念,Kettle的安装 和使用,如何使用Kettle实 现数据抽取、数据清洗、数 据转换和数据加载,并在最 后综合运用上述知识,构建 一个电影租赁商店数据仓库 ,以使读者加深对Kettle和 ETL的理解与掌握。 本书附有配套视频、教 学PPT、教学设计、测试题 等资源,同时,为了帮助初 学者更好地学习本书中的内 容,还提供了在线答疑,欢 迎读者关注。 本书可以作为高等院校 数据科学与大数据技术及相 关专业的教材,也适合大数 据开发初学者、ETL工程师 以及数仓开发的从业者阅读 。
目录
第1章 数据清洗概述 1.1 数据清洗的背景 1.1.1 数据质量概述 1.1.2 数据质量的评价指标 1.1.3 数据质量问题的分类 1.2 数据清洗的定义 1.3 数据清洗基本流程 1.4 数据清洗策略 1.5 数据清洗常用的方法 1.6 数据清洗面临的挑战 1.7 本章小结 1.8 课后习题 第2章 初识ETL 2.1 ETL的定义 2.2 ETL的体系结构 2.3 ETL关键步骤 2.3.1 抽取 2.3.2 转换 2.3.3 加载 2.4 常见的ETL工具 2.5 本章小结 2.6 课后习题 第3章 Kettle 3.1 初识Kettle 3.1.1 Kettle简介 3.1.2 Kettle的特点 3.2 Kettle的安装与启动 3.3 Kettle的转换和作业 3.3.1 转换 3.3.2 作业 3.4 Kettle的基本操作 3.4.1 转换管理 3.4.2 作业管理 3.4.3 数据库连接 3.5 本章小结 3.6 课后习题 第4章 数据抽取 4.1 从文件中抽取数据 4.1.1 从CSV文件中抽取数据 4.1.2 从TSV文件中抽取数据 4.1.3 从JSON文件中抽取数据 4.1.4 从XML文件中抽取数据 4.1.5 从HDFS中抽取数据 4.2 从数据库中抽取数据 4.2.1 从关系数据库中抽取数据 4.2.2 从非关系数据库中抽取数据 4.3 从Hive中抽取数据 4.4 从HTML页面中抽取数据 4.5 本章小结 4.6 课后习题

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网