您好,欢迎来到聚文网。 登录 免费注册
Spark大数据实时分析实战

Spark大数据实时分析实战

  • 字数: 375000
  • 装帧: 平装
  • 出版社: 北京理工大学出版社
  • 出版日期: 2020-12-01
  • 商品条码: 9787568288446
  • 版次: 1
  • 开本: 16开
  • 页数: 260
  • 出版年份: 2020
定价:¥75 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书分为六个项目,通过真实大数据实时分析项目的导入,引导读者完成大数据实时分析平台Spark的搭建,通过对基于Hadoop生态圈中Yarn资源调度框架,搭建Spark日志管理系统,搭建Kafka分布式消息系统,在工作中实现使用SparkStreaming实时读取Kafka中的数据进行实时处理。本书适用于大数据技术与应用、数据科学与大数据技术等电子信息类专业教学的教材,也可作为工程技术人员的参考书。
目录
项目一初识Spark技术
任务1.1数据处理系统
1.1.1数据存储技术
1.1.2数据分析技术
1.1.3批数据和实时数据
1.1.4数据价值挖掘
任务1.2实时数据处理
1.2.1实时数据的价值
1.2.2实时数据处理技术
1.2.3Spark实时数据处理
项目二Spark集群的构建与安装
任务2.1Spark集群搭建
2.1.1平台选择
2.1.2软件选择
2.1.3Spark集群构建流程
任务2.2Spark集群规划
2.2.1Spark集群节点划分
2.2.2软件要求
2.2.3网络拓扑结构规划
任务2.3Spark安装准备
2.3.1JDK安装
2.3.2节点间的配置
2.3.3Spark安装包下载
任务2.4Spark集群搭建
2.4.1配置Master节点
2.4.2配置Worker节点
2.4.3分发安装包
2.4.4启动集群
任务2.5验证Spark
2.5.1验证Spark进程
2.5.2验证WEBUI界面
2.5.3验证集群功能
任务2.6Spark客户端搭建
2.6.1客户端介绍
2.6.2客户端搭建及使用
项目三Spark基于Yarn搭建
任务3.1基于Yarn构建介绍
3.1.1基于Yarn搭建环境配置
3.1.2Hadoop集群
3.1.3启动Hadoop集群
3.1.4验证Hadoop集群节点
任务3.2基于Yam搭建
3.2.1节点划分配置
3.2.2配置SparkonYarn
3.2.3验证SparkonYarn
项目四日志服务器搭建
任务4.1日志服务器配置
4.1.1HDFS配置
4.1.2Spark配置
4.1.3启动日志服务器
4.1.4查看日志
任务4.2验证日志服务器
4.2.1Spark-Shell介绍
4.2.2查看运行日志
4.2.3启动日志服务器
4.2.4查看日志
项目五Kafka集群的构建与安装
任务5.1集群搭建
5.1.1运行平台支持
5.1.2软件环境
5.1.3集群构建流程
任务5.2集群规划
5.2.1集群节点划分
5.2.2软件选择
5.2.3网络结构规划
任务5.3安装准备
5.3.1节点免密
5.3.2安装ZooKeeper协调系统
任务5.4Kafka集群搭建
5.4.1节点配置
5.4.2集群脚本配置
5.4.3分发安装包
5.4.4集群启动
项目六Kafka集群测试
任务6.1分布式消息系统
6.1.1Kafka介绍
6.1.2Kafka架构
6.1.3Kafka的特点
6.1.4Kafka应用场景
任务6.2测试Kafka
6.2.1查看集群中的Topic
6.2.2创建Topic
6.2.3向Topic生产消息
6.2.4从Topic消费消息
6.2.5offset查看
6.2.6删除Topic信息
任务6.3测试KafkaLeader
6.3.1Leader均衡机制
6.3.2测试Leader均衡机制

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网