您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
HBase与Hive数据仓库应用开发
字数: 428800
装帧: 平装
出版社: 电子工业出版社
出版日期: 2023-08-01
商品条码: 9787121461026
版次: 1
开本: 16开
页数: 268
出版年份: 2023
定价:
¥49
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
"本书特色如下。 1. 以项目任务为导向,实现启发式教学。本书注重特色与创新,全书的内容紧扣项目需求并拆分成多个任务。每个任务包括任务描述、任务要求、相关知识、任务实施等内容,根据任务需求讲解知识点,着重于启发思路和提供解决方案,让读者对实际项目的流程有初步认识。本书内容由浅入深,让读者能明确如何利用所学知识解决问题,实现海量数据集的存储和分析。 2. 体现思政育人。党的二十大报告指出,青年强,则国家强。本书的每个项目都融入了知识目标、技能目标、素养目标,让读者对该项目有初步了解,并帮助读者在学习过程中树立正确的观念,提升多方面的素养和能力。此外,每个项目都融入了课程思政内容,帮助读者提高认识问题、分析问题、解决问题的能力,引导读者在学习过程中培养大数据思维,树立正确的人生观和职业道德观,养成求真务实的科学精神和追求突破的工匠精神,加快推进党的二十大精神进教材、进课堂、进头脑。 3. 基于企业的真实场景和应用,结合理论与实践。本书在介绍了 HBase 与 Hive 的相关知识后,结合具体项目讲解了综合实战案例。本书的案例来自企业在实际业务中遇到的真实场景,对读者有一定的实践指导作用,能帮助读者提高大数据存储与分析的基本能力,同时培养良好的案例分析能力及思考能力。 "
内容简介
本书以项目任务为导向,介绍了HBase分布式数据库和Hive分布式数据仓库的相关知识。本书共有9个项目,包括认识数据库与数据仓库、安装与部署HBase、使用HBase Shell构建博客数据库系统、使用HBaseJava API开发博客数据库系统、安装与配置Hive结构化数据仓库、使用Hive定义优惠券数据、使用HiveShell实现优惠券消费数据的分析及处理、使用Hive Java API开发优惠券消费数据分析应用、基于HBase和Hv的电信运营商用户数据分析实战。本书设置了任务实训及课后习题,帮助读者通过练习和实践巩固所学内容,快速掌握HBase与Hive存储工具的操作方法。本书可以作为高等院校大数据技术相关专业的教材,也可以作为大数据技术或数据库爱好者的自学用书。通过学习本书,读者在提升大数据存储技术的同时,能够养成自主学习的意识,提高发现问题、分析问题、解决问题的能力,具备良好的独立思考能力,养成敬业、精益、专注的工匠精神。
作者简介
"唐美霞,女,生于1982年03月,2003年毕业于湖南师范大学计算机科学与技术专业(本科),2010年毕业于湖南科技大学计算机应用技术专业(硕士研究生),中共党员,大数据技术专业教师、工学硕士、副教授、南宁市高层次人才(E类)、华为ICT学院大数据讲师,新华三公司大数据平台运维认证讲师,教育厅认定的“双师”型教师。 参加工作20年以来,曾主讲《C#程序设计》、《数据结构》、《MySQL数据库》、《Linux操作系统》、《数据挖掘与机器学习》、《Hbase与Hive数据仓库应用开发》、《Hadoop开发基础》等课程;在教学工作中坚持教育教学改革,不断探索新的教学模式和教学方法,取得了良好的效果;主编《Java程序设计》一部,《SQL Server 2012 数据库原理及应用》一部,参编《Flash CS5实用案例教程》一部,2020年12月,参加全国高等院校计算机类专业教学能力大赛获二等奖(作品:Hadoop开发基础);2017年-2021年指导学生参加全国职业院校技能大赛高职组“大数据技术与应用”赛项,2017年获区赛一等奖,全国三等奖,2018年-2021年获区赛二等奖;2019年指导学生参加中国软件杯全国大学生软件设计大赛荣获全国三等奖;2019-2020年连续两年指导学生参加广西大学生人工智能设计大赛,荣获一等奖,优秀指导教师。2019-2020年连续两年指导学生参加全国大学生数学建模竞赛广西选拔赛荣获三等奖。 秉承“以科研促教学,以教学带科研”的理念,坚持进行学术研究,主要研究方向为软件技术、大数据技术、算法分析。近年来在《计算机工程与设计》、《湖南科技大学学报(自然科学版)》、《制造业自动化》、《广西教育》等刊物上发表学术论文20余篇,其中核心论文6篇,主持完成市厅级课题3项,主持在研市厅级课题2项,参与省部级科研课题2项,参与完成市厅级课题6项,获得发明专利1项,实用新型专利1项,软件著作权16项。 "
目录
项目1 认识数据库与数据仓库 1
【教学目标】 1
【背景描述】 1
任务 1 了解大数据 2
【任务描述】 2
【任务要求】 2
【相关知识】 2
1.1.1 大数据的概念及发展历程 2
1.1.2 大数据的数据类型 2
1.1.3 大数据的特点 3
1.1.4 大数据的行业应用 4
1.1.5 大数据的技术体系 5
任务 2 了解大数据存储技术 7
【任务描述】 7
【任务要求】 7
【相关知识】 7
1.2.1 大数据存储简介 7
1.2.2 基于文件系统的数据存储 8
1.2.3 基于数据库的数据存储 9
1.2.4 基于数据仓库的数据存储 10
项目总结 10
课后习题 11
项目2 安装与部署HBase 12
【教学目标】 12
【背景描述】 12
任务 1 搭建接近分布式 Hadoop 集群 13
【任务描述】 13
【任务要求】 13
【相关知识】 13
2.1.1 Hadoop 简介 13
2.1.2 Hadoop 的核心组件 14
2.1.3 Hadoop 生态系统 17
2.1.4 搭建 Hadoop 集群前的准备工作 19
【任务实施】 19
【任务实训】 47
任务 2 安装 ZooKeeper 集群 47
【任务描述】 47
【任务要求】 47
【相关知识】 48
2.2.1 ZooKeeper 简介 48
2.2.2 ZooKeeper 的架构 48
【任务实施】 49
任务 3 安装与配置 HBase 集群 51
【任务描述】 51
【任务要求】 51
【相关知识】 52
2.3.1 HBase 简介 52
2.3.2 HBase 的核心功能模块 53
2.3.3 HBase 的读/写流程 54
【任务实施】 55
【任务实训】 58
项目总结 59
课后习题 59
项目3 使用HBase Shell 构建博客数据库系统 60
【教学目标】 60
【背景描述】 60
任务 1 设计 HBase 表 61
【任务描述】 61
【任务要求】 61
【相关知识】 61
3.1.1 HBase 的数据模型 61
3.1.2 HBase 表的结构设计原则 62
3.1.3 HBase 的检索方式 63
3.1.4 RowKey 设计原则 63
3.1.5 热点问题 63
3.1.6 列族设计原则 64
【任务实施】 65
任务 2 创建 HBase 表 66
【任务描述】 66
【任务要求】 66
【相关知识】 66
3.2.1 命名空间 66
3.2.2 创建表 67
3.2.3 查看表结构 68
3.2.4 修改表 69
3.2.5 删除表 69
【任务实施】 69
【任务实训】 70
任务 3 查询 HBase 表数据 70
【任务描述】 70
【任务要求】 70
【相关知识】 71
3.3.1 插入数据 71
3.3.2 查询数据 72
3.3.3 扫描全表数据 72
3.3.4 删除数据 73
3.3.5 清空数据 73
【任务实施】 73
【任务实训】 75
任务 4 查询符合指定条件的 HBase 表数据 76
【任务描述】 76
【任务要求】 76
【相关知识】 77
3.4.1 HBase 高级查询 77
3.4.2 HBase 的抽象操作符 77
3.4.3 HBase 的比较器 77
3.4.4 HBase 的过滤器 78
【任务实施】 79
【任务实训】 79
项目总结 80
课后习题 80
项目4 使用HBase Java API 开发博客数据库系统 82
【教学目标】 82
【背景描述】 82
任务 1 搭建 HBase 开发环境 83
【任务描述】 83
【任务要求】 83
【任务实施】 83
任务 2 插入并查询数据 95
【任务描述】 95
【任务要求】 95
【相关知识】 95
4.2.1 HBase Java API 的主要接口与类 95
4.2.2 使用 HBase Java API 创建命名空间和表 98
4.2.3 使用 HBase Java API 插入数据 99
4.2.4 使用 HBase Java API 查询数据 100
4.2.5 使用 HBase Java API 进行全表查询 101
【任务实施】 102
【任务实训】 111
任务 3 查询符合指定条件的数据 112
【任务描述】 112
【任务要求】 112
【相关知识】 112
4.3.1 Hbase 过滤器API 112
【任务实施】 114
【任务实训】 120
任务 4 实现 MapReduce 与 HBase 表的集成 120
【任务描述】 120
【任务要求】 121
【相关知识】 121
4.4.1 Hadoop 集群运行 MapReduce 程序 121
4.4.2 将数据导入 Hbase 表中 122
4.4.3 导出 HBase 表中的数据 123
【任务实施】 123
【任务实训】 128
项目总结 129
课后习题 129
项目5 安装与配置Hive 结构化数据仓库 131
【教学目标】 131
【背景描述】 131
任务 1 安装与配置 Hive 132
【任务描述】 132
【任务要求】 132
【相关知识】 132
5.1.1 Hive 的起源与发展 132
5.1.2 Hive 与传统数据库的对比 132
5.1.3 Hive 的系统架构 133
5.1.4 Hive 的工作原理 134
5.1.5 安装前的准备工作 135
【任务实施】 135
【任务实训】 142
任务 2 在 Hive CLI 界面执行 Shell 命令和 dfs 命令 143
【任务描述】 143
【任务要求】 143
【相关知识】 143
5.2.1 在文件中执行 Hive 查询 143
5.2.2 在 Hive 中执行 Linux Shell 命令 145
5.2.3 在 Hive 中使用 Hadoop 的 dfs 命令 146
5.2.4 在 Hive 脚本中进行注释 147
【任务实施】 148
【任务实训】 149
项目总结 150
课后习题 150
项目6 使用Hive 定义优惠券数据 152
【教学目标】 152
【背景描述】 152
任务 1 创建 Hive 表 153
【任务描述】 153
【任务要求】 153
【相关知识】 153
6.1.1 Hive 的数据类型 153
6.1.2 创建与管理数据仓库 154
6.1.3 创建表 156
6.1.4 修改表 160
【任务实施】 161
【任务实训】 162
任务 2 向Hive 表中导入数据 163
【任务描述】 163
【任务要求】 163
【相关知识】 163
6.2.1 导入数据 163
6.2.2 导出数据 167
【任务实施】 168
【任务实训】 169
项目总结 170
课后习题 170
项目7 使用Hive Shell 实现优惠券消费数据的分析及处理 172
【教学目标】 172
【背景描述】 172
任务 1 查询领取了优惠券的用户信息 173
【任务描述】 173
【项目要求】 173
【相关知识】 173
7.1.1 select 基本查询 173
7.1.2 limit 结果 175
7.1.3 distinct 去重查询 176
7.1.4 where 条件查询 176
7.1.5 Hive 内置运算符 177
7.1.6 正则表达式 179
【任务实施】 180
【任务实训】 182
任务 2 构建用户标签列 183
【任务描述】 183
【任务要求】 183
【相关知识】 183
7.2.1 case……when……语句的使用 183
7.2.2 group by 分组查询 184
7.2.3 having 条件筛选 185
【任务实施】 185
【任务实训】 186
任务 3 构建用户特征字段 187
【任务描述】 187
【任务要求】 187
【相关知识】 187
7.3.1 Hive 内置函数 187
7.3.2 排序查询 193
【任务实施】 193
【任务实训】 197
任务 4 连接用户特征字段 198
【任务描述】 198
【任务要求】 198
【相关知识】 198
7.4.1 union 结果集合并 198
7.4.2 join 连接表数据 200
【任务实施】 201
【任务实训】 202
项目总结 202
课后习题 203
项目8 使用Hive Java API 开发优惠券消费数据分析应用 205
【教学目标】 205
【背景描述】 205
任务 1 搭建 Hive 开发环境 206
【任务描述】 206
【任务要求】 206
【任务实施】 206
任务 2 编写自定义函数统计优惠券折扣 212
【任务描述】 212
【任务要求】 212
【相关知识】 213
8.2.1 Hive 自定义函数 213
8.2.2 UDF 函数 213
8.2.3 UDAF 函数 217
8.2.4 UDTF 函数 218
【任务实施】 220
【任务实训】 221
任务 3 构建及合并特征字段 222
【任务描述】 222
【任务要求】 222
【相关知识】 222
8.3.1 Hive Java API 的主要类 222
8.3.2 执行 SQL 语句的方法 224
【任务实施】 225
【任务实训】 229
项目总结 230
课后习题 230
项目9 基于HBase 和Hive 的电信运营商用户数据分析实战 233
【教学目标】 233
【背景描述】 233
任务 1 案例背景和需求分析 233
【任务描述】 233
【任务要求】 234
【任务实施】 234
任务 2 数据预处理 236
【任务描述】 236
【任务要求】 236
【任务实施】 236
任务 3 用户数据的基本查询 240
【任务描述】 240
【任务要求】 240
【任务实施】 240
任务 4 分析用户通话情况 241
【任务描述】 241
【任务要求】 242
【任务实施】 242
任务 5 将 Hive 的数据导入 HBase 中 244
【任务描述】 244
【任务要求】 244
【任务实施】 244
项目总结 253
附录 大数据组件的常用端口及其说明 254
参考文献 256
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网