您好,欢迎来到聚文网。 登录 免费注册
Spark项目实训(Python版)/大数据技术与应用丛书

Spark项目实训(Python版)/大数据技术与应用丛书

  • 字数: 277
  • 出版社: 清华大学
  • 作者: 编者:黑马程序员|
  • 商品条码: 9787302685302
  • 适读年龄: 12+
  • 版次: 1
  • 开本: 16开
  • 页数: 184
  • 出版年份: 2025
  • 印次: 1
定价:¥39 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书以电商网站中的用 户行为数据作为数据源,系 统介绍了使用Spark生态系 统进行离线分析和实时分析 的方法。全书共6章,分别 讲解了项目概述、搭建集群 环境、使用Flume实现数据 采集、使用Hive构建数据仓 库、使用Spark进行数据分 析以及使用FineBI实现数据 可视化。 本书适合作为高等学校 数据科学与大数据技术及相 关专业的教材,也适合数据 分析、数据可视化等领域的 从业者阅读。
目录
第1章 项目概述 1.1 项目需求和目标 1.2 预备知识 1.3 项目架构 1.4 开发环境和工具 1.5 项目开发流程 1.6 本章小结 第2章 搭建集群环境 2.1 基础环境搭建 2.1.1 创建虚拟机 2.1.2 安装Linux操作系统 2.1.3 克隆虚拟机 2.1.4 配置虚拟机 2.2 安装JDK 2.3 部署Hadoop集群 2.4 部署Hive 2.5 部署Flume 2.6 部署ZooKeeper集群 2.7 部署Kafka集群 2.8 部署Spark 2.9 部署Doris集群 2.10 本章小结 第3章 数据采集 3.1 用户行为数据概述 3.2 模拟生成用户行为数据 3.2.1 生成历史用户行为数据 3.2.2 生成实时用户行为数据 3.3 配置采集方案 3.4 采集用户行为数据 3.5 本章小结 第4章 数据仓库 4.1 数据仓库设计 4.2 构建数据仓库 4.3 向数据仓库加载数据 4.3.1 向ODS层的表加载数据 4.3.2 向DWD层的表加载数据 4.4 本章小结 第5章 数据分析 5.1 流量分析 5.2 商品分析 5.3 设备分析 5.4 推荐系统 5.5 地域分析 5.6 本章小结 第6章 数据可视化 6.1 Doris集成Hive 6.2 FineBI的安装与配置 6.3 实现数据可视化 6.3.1 新建数据集 6.3.2 实现流量分析的可视化 6.3.3 实现商品分析的可视化 6.3.4 实现设备分析的可视化 6.3.5 实现地域分析的可视化 6.4 本章小结

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网