您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Hive数据仓库应用
装帧: 平装
出版社: 清华大学出版社
作者: 黑马程序员
出版日期: 2021-09-01
商品条码: 9787302589594
版次: 1
开本: 其他
页数: 284
出版年份: 2021
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
"Hive提出海量数据可以继续沿用传统数据分析方法SQL语句来处理的思想,开发人员不需要学习新的计算机语言而继续使用熟悉的SQL结构化查询语句来处理大规模的数据,Hive中的SQL语句我们称之为HiveQL查询语句,HiveQL查询语句的语法结构与传统SQL语句的语法结构几乎是一模一样的。Hive运行在Hadoop分布式系统中,这使得Hive不仅可以使用HDFS进行分布式存储,而且还可以通过MapReduce分布式计算框架来查询数据,相比于传统数据仓库来说,Hive在存储性能和查询效率上都得到了很好的提升。 本书将带领大家认识Hive的相关技术。通过学习本书,使读者对Hive有一个深刻的认识,本书共分为9章。"
内容简介
本书从理论知识入手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。“工欲善其事,必先利其器”,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他功能,包括Hive内置函数、Hive自定义函数、Hive的新特性事务以及Hive的相关优化,从而帮助读者掌握Hive的强大功能和特性。最后,本书通过一个综合项目——教育大数据分析平台,使读者对Hive数据仓库在实际应用中涉及的相关知识内容具有更深入的理解,在此项目中不仅会涉及使用Hive实现数据仓库分层、数据转换和数据分析的相关操作,而且还涉及使用Sqoop将数据仓库中的数据进行导出和导入,以及使用FineBI工具实现数据可视化功能。 本书附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习本书的内容,还提供了在线答疑,欢迎读者关注。 本书可以作为高等学校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可以供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。
作者简介
江苏传智播客教育科技股份有限公司(简称“传智教育”)是一家致力于培养高素质软件开发人才的科技公司,“黑马程序员”是传智教育旗下高端IT教育品牌。高美云是本书创作团队核心成员,编写过多本教材,均畅销多年,深受读者喜爱。
目录
第1章Hive简介1 1.1认识数据仓库1 1.1.1数据仓库简介1 1.1.2数据仓库分层3 1.1.3数据仓库的数据模型5 1.2Hive概述6 1.3Hive架构7 1.4Hive工作原理8 1.5Hive数据类型9 1.6本章小结10 1.7课后习题11 第2章Hive部署12 2.1Linux环境的搭建12 2.1.1创建虚拟机12 2.1.2启动虚拟机并安装Linux操作 系统19 2.1.3克隆虚拟机26 2.1.4配置Linux系统网络及主机名30 2.1.5配置SSH服务34 2.2JDK的部署42 2.3Zookeeper的部署43 2.3.1Zookeeper集群的安装与配置43 2.3.2Zookeeper集群的启动与关闭46 2.4Hadoop的部署48 2.4.1Hadoop高可用集群的规划48 2.4.2安装Hadoop49 2.4.3配置Hadoop高可用集群51 2.4.4启动Hadoop高可用集群58 2.5Hive的部署622.5.1Hive部署之嵌入模式62 2.5.2Hive部署之本地模式64 2.5.3Hive部署之远程模式70 2.6本章小结74 2.7课后习题74 目录Hive数据仓库应用第3章Hive的数据定义语言76 3.1数据库的基本操作76 3.1.1创建数据库76 3.1.2查询数据库77 3.1.3查看数据库信息78 3.1.4切换数据库79 3.1.5修改数据库79 3.1.6删除数据库80 3.2数据表的基本操作81 3.2.1CREATE TABLE句式分析81 3.2.2数据表简介84 3.2.3创建数据表84 3.2.4查看数据表86 3.2.5修改数据表88 3.2.6删除数据表94 3.3分区表95 3.3.1创建分区表95 3.3.2查询分区表96 3.3.3添加分区97 3.3.4重命名分区98 3.3.5移动分区98 3.3.6删除分区100 3.4分桶表101 3.4.1创建分桶表101 3.4.2查看分桶表信息102 3.5临时表103 3.6视图104 3.6.1创建视图105 3.6.2查询视图信息105 3.6.3查看视图106 3.6.4修改视图107 3.6.5删除视图109 3.7索引109 3.7.1Hive中的索引110 3.7.2创建索引110 3.7.3查看索引表111 3.7.4查看索引111 3.7.5重建索引112 3.7.6删除索引113 3.8本章小结114 3.9课后习题114 第4章Hive的数据操作语言116 4.1加载文件116 4.1.1加载文件的语法格式116 4.1.2向分区表加载文件119 4.2基本查询120 4.3插入数据121 4.3.1基本插入121 4.3.2查询插入123 4.3.3向分区表插入数据127 4.4IMPORT和EXPORT131 4.5本章小结133 4.6课后习题133 第5章Hive数据查询语言135 5.1SELECT句式分析135 5.2Hive运算符138 5.2.1关系运算符138 5.2.2算术运算符140 5.2.3逻辑运算符142 5.2.4复杂运算符143 5.3公用表表达式146 5.4分组操作147 5.5排序操作149 5.6UNION语句154 5.7JOIN语句156 5.8抽样查询161 5.8.1随机抽样161 5.8.2分桶抽样162 5.8.3数据块抽样162 5.9本章小结164 5.10课后习题164 第6章Hive函数165 6.1Hive内置函数165 6.1.1聚合函数165 6.1.2数学函数169 6.1.3集合函数170 6.1.4类型转换函数171 6.1.5日期函数172 6.1.6条件函数176 6.1.7字符串函数178 6.1.8表生成函数182 6.2Hive自定义函数185 6.2.1UDF186 6.2.2UDTF196 6.2.3UDAF199 6.3本章小结203 6.4课后习题203 第7章Hive事务205 7.1事务特性205 7.2Hive事务的设计与实现206 7.3开启Hive事务207 7.4更新操作209 7.5删除操作210 7.6本章小结211 7.7课后习题211 第8章Hive优化213 8.1Hive存储优化213 8.2Hive参数优化215 8.2.1配置MapReduce压缩215 8.2.2配置Map个数216 8.2.3配置Reduce个数217 8.2.4配置合并文件217 8.2.5配置并行执行218 8.2.6配置本地模式218 8.2.7配置分组219 8.3HiveQL语句优化技巧219 8.4本章小结219 8.5课后习题220 第9章综合项目——教育大数据分析平台221 9.1项目概述221 9.1.1项目背景介绍221 9.1.2需求分析222 9.1.3原始数据结构222 9.1.4数据仓库分层设计223 9.1.5项目架构224 9.2部署Sqoop225 9.3实现数据仓库分层227 9.4数据采集231 9.5数据转换235 9.6数据分析237 9.6.1实现地区访问用户量统计237 9.6.2实现会话页面排行榜238 9.6.3实现访问用户量统计240 9.6.4实现来源渠道访问用户量统计241 9.6.5实现咨询率统计242 9.7数据可视化245 9.7.1导出数据245 9.7.2安装、启动与配置FineBI247 9.7.3实现数据可视化260 9.8本章小结271
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网