您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
实战大数据 分布式大数据分析处理系统开发与应用
字数: 374000
装帧: 平装
出版社: 机械工业出版社
出版日期: 2023-01-01
商品条码: 9787111720652
版次: 1
开本: 32开
页数: 472
出版年份: 2023
定价:
¥79.9
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
面向大数据开发工程师、大数据运维工程师 五大实战项目,详解大数据分析处理系统(离线/实时)的技术构成与开发实现 随书配备10GB学习资源,包括虚拟机集群、安装包、 配置文件、程序源代码
内容简介
本书从大数据技术基础概念出发,介绍了大数据分析的流程和大数据分析处理系统的组成,以及大数据集群的搭建,并在此基础上讲解了多种不同技术构成的离线/实时数据分析系统实战项目。全书共10章,包括大数据概述、大数据分析的基本流程与工具、分布式大数据分析处理系统概述、构建大数据集群环境、构建基于LayUI的集群管理系统、基于HBase的大数据离线分析系统、基于Hive+Hadoop+Spark的大数据离线分析系统、基于MySQL+Spark的大数据离线分析系统、基于Redis+Kafka+Spark的大数据实时分析系统、基于Flume+Kafka+Flink的大数据实时分析系统。本书适合从事大数据系统搭建与运维、大数据分析等岗位的技术人员阅读,也适合高等院校大数据相关专业的学生使用。
目录
前言
第1章 大数据概述1
1.1 大数据的基本概念1
1.1.1 何谓大数据1
1.1.2 大数据的产生阶段2
1.1.3 大数据的核心技术和计算模式2
1.2 大数据的应用2
1.2.1 大数据的应用场景2
1.2.2 大数据系统的作用2
1.3 大数据技术生态圈3
1.3.1 Linux操作系统3
1.3.2 Hadoop生态系统6
1.3.3 Spark对Hadoop的完善8
1.4 大数据技术的新发展9
1.4.1 Hadoop 3.0的新特性9
1.4.2 大数据引擎Flink10
1.4.3 智能化大数据分析处理11
本章小结12
第2章 大数据分析的基本流程与工具13
2.1 数据采集13
2.1.1 网络爬虫采集数据13
2.1.2 使用Excel爬取数据14
2.2 数据存储16
2.2.1 关系型数据的存储——基于MySQL16
2.2.2 非关系型数据的存储——基于Redis、HBase17
2.3 数据分析与数据处理18
2.3.1 数据分析常用工具——pandas19
2.3.2 分布式计算框架19
2.3.3 分布式数据挖掘和深度学习20
2.4 数据可视化22
2.4.1 Python数据可视化库Matplotlib22
2.4.2 Python数据可视化库pyecharts22
2.4.3 数据可视化图表库ECharts23
2.4.4 数据可视化工具Apache Superset24
本章小结24
第3章 分布式大数据分析处理系统概述25
3.1 什么是分布式大数据分析处理系统25
3.2 分布式大数据分析处理系统的作用26
3.3 分布式大数据分析处理系统的应用场景26
3.4 分布式大数据分析处理系统的构成30
3.4.1 数据采集子系统30
3.4.2 数据存储系统30
3.4.3 数据分析处理系统31
3.4.4 数据可视化系统32
3.5 分布式大数据分析处理系统的实现32
3.5.1 系统前端——HTML、CSS、jQuery32
3.5.2 系统后端——SpringBoot、SSM33
3.5.3 Web服务器端——Tomcat35
本章小结35
第4章 构建大数据集群环境36
4.1 部署大数据处理环境36
4.1.1 搭建Hadoop集群36
4.1.2 ZooKeeper的安装部署42
4.1.3 Kafka的安装部署45
4.1.4 Spark集群搭建47
4.2 部署大数据存储环境49
4.2.1 MySQL的安装部署49
4.2.2 Hive的安装部署50
4.2.3 HBase的安装部署51
4.2.4 Redis的安装部署55
本章小结57
第5章 构建基于LayUI的集群管理系统58
5.1 集群管理系统概述58
5.1.1 需求分析58
5.1.2 系统架构——系统+集群+UI59
5.2 系统开发的前期准备操作60
5.2.1 本机环境配置60
5.2.2 集群环境配置62
5.2.3 构建项目工程结构74
5.3 系统的代码实现75
5.3.1 Controller层实现75
5.3.2 构造系统所需工具包90
5.3.3 核心类实现97
5.4 构造系统UI界面——基于LayUI100
本章小结105
第6章 基于HBase的大数据离线分析系统106
6.1 系统架构概述106
6.1.1 需求分析106
6.1.2 系统架构——HBase+SpringBoot+ECharts107
6.2 采集股份转让数据108
6.2.1 使用爬虫抓取数据108
6.2.2 数据采集模块测试111
6.3 数据存储和处理模块实现113
6.3.1 数据库设计113
6.3.2 使用HBase存储并处理数据114
6.3.3 数据存储和处理模块测试119
6.4 数据可视化模块实现120
6.4.1 数据可视化模块后端设计——基于SpringBoot120
6.4.2 数据可视化模块前端设计——基于ECharts122
6.4.3 数据可视化页面展示125
本章小结126
第7章 基于Hive+Hadoop+Spark的大数据离线分析系统127
7.1 系统架构概述127
7.1.1 需求分析127
7.1.2 数据存储——Hive+Hadoop129
7.1.3 数据处理与可视化——Spark+SSM+ECharts129
7.2 采集旅游相关数据130
7.2.1 使用爬虫采集城市、景点数据130
7.2.2 数据采集模块测试133
7.3 数据存储模块实现135
7.3.1 数据库设计135
7.3.2 使用HDFS和Hive存储数据137
7.3.3 数据存储模块测试138
7.4 数据分析处理模块实现139
7.4.1 Spark处理数据139
7.4.2 分词处理和情感分析——基于jieba+SnowNLP库139
7.4.3 数据分析处理模块测试142
7.5 数据可视化模块实现143
7.5.1 数据可视化模块后端设计——基于SSM143
7.5.2 数据可视化模块前端设计——基于ECharts154
7.5.3 数据可视化页面展示161
本章小结167
第8章 基于MySQL+Spark的大数据离线分析系统168
8.1 系统架构概述168
8.1.1 需求分析168
8.1.2 数据存储——MySQL170
8.1.3 数据处理与可视化——Spark Streaming +Apache Superset170
8.2 采集电商数据170
8.2.1 使用爬虫爬取商品信息170
8.2.2 数据采集模块测试182
8.3 数据分析处理模块实现183
8.3.1 数据库设计183
8.3.2 Spark处理商品数据185
8.3.3 数据分析处理模块测试192
8.4 数据可视化模块实现193
8.4.1 使用Apache Superset绘制数据可视化图表193
8.4.2 数据可视化页面展示193
本章小结196
第9章 基于Redis+Kafka+Spark的大数据实时分析系统197
9.1 系统架构概述197
9.1.1 需求分析197
9.1.2 数据存储——Redis198
9.1.3 数据处理与可视化——Kafka+Spark Streaming+SSM+ECharts199
9.2 采集汽车网站数据199
9.2.1 使用爬虫获取汽车和用户数据199
9.2.2 数据采集模块测试201
9.3 数据存储模块实现201
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网