您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Hive入门与大数据分析实战
字数: 377000
装帧: 平装
出版社: 清华大学出版社
作者: 迟殿委
出版日期: 2023-06-01
商品条码: 9787302634218
版次: 1
开本: 16开
页数: 224
出版年份: 2023
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
《Hive入门与大数据分析实战》本系统讲解数据仓库和Hive的基本概念、Hive部署过程、Hive语法基础、Hive数据定义、Hive数据操纵、Hive数据查询、Hive函数、Hive数据压缩、Hive调优,并通过网站流量分析大数据、旅游酒店评价大数据分析两个综合项目,帮助读者提升大数据分析的实战能力。 配套全书示例源码、PPT课件、作者答疑服务。
内容简介
Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive能将结构化的数据文件映射为一张数据库表,并能提供SQL查询分析功能,将SQL语句转换成MapReduce任务来执行,从而实现对数据进行分析的目的。本书配套示例源码、PPT课件、教学大纲。本书可作为Hive数据仓库初学者的入门书,也可作为Hive大数据分析与大数据应用开发工程师的指导手册,还可作为高等院校或者高职高专计算机技术、人工智能、大数据技术及相关专业的教材或教学参考书。 《Hive入门与大数据分析实战》共分11章,内容包括数据仓库与Hive、Hive部署与基本操作、Hive语法基础、Hive数据定义、Hive数据操作、Hive查询、Hive函数、Hive数据压缩、Hive调优、基于Hive的网站流量分析项目实战、旅游酒店评价大数据分析项目实战。最后的两个项目实战(均包括SQL和Java编程两种解决方法)帮助读者提高Hive大数据分析的综合实战能力。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,也可以作为高等学校相关专业的本科生、研究生的教学用书。
作者简介
迟殿委,计算机软件与理论专业硕士,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE、大数据技术培训经验,熟练掌握JavaEE与大数据全栈技术框架,擅长JavaEE系统架构设计、大数据分析与挖掘。著有图书《Hive入门与大数据分析实战》《Hadoop大数据分析技术》《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》《深入浅出Java编程》《Spring Boot+Spring Cloud微服务开发》。
目录
第1章 数据仓库与Hive1
1.1 数据仓库概述1
1.1.1 数据仓库特征与重要概念1
1.1.2 数据仓库的数据存储方式2
1.2 Hive数据仓库简介5
1.3 Hive版本和MapReduce版本的WordCount比较6
1.4 Hive和Hadoop的关系7
1.5 Hive和关系数据库的异同8
1.6 Hive数据存储简介9
第2章 Hive部署与基本操作11
2.1 Linux环境的搭建11
2.1.1 VirtualBox虚拟机安装11
2.1.2 安装Linux操作系统13
2.1.3 SSH工具与使用19
2.1.4 Linux统一设置21
2.2 Hadoop伪分布式环境的搭建23
2.2.1 安装本地模式运行的Hadoop23
2.2.2 Hadoop伪分布式环境的准备25
2.2.3 Hadoop伪分布式的安装29
2.3 Hadoop接近分布式环境的搭建35
2.3.1 Hadoop接近分布式集群的搭建35
2.3.2 ZooKeeper高可靠集群的搭建40
2.3.3 Hadoop高可靠集群的搭建44
2.4 Hive的安装与配置53
2.4.1 Hive的安装与启动53
2.4.2 基本的SQL操作命令54
2.5 Hive的一些命令56
2.5.1 显示Hive的帮助56
2.5.2 显示Hive某个命令的帮助56
2.5.3 变量与属性56
2.5.4 指定SQL语句或文件57
2.5.5 显示表头58
2.6 Hive元数据库58
2.6.1 Derby58
2.6.2 MySQL60
2.7 MySQL的安装61
2.8 配置MySQL保存Hive元数据62
2.9 HiveServer2与Beeline配置65
第3章 Hive语法基础68
3.1 数据类型列表68
3.2 集合类型69
3.2.1 array测试70
3.2.2 map测试71
3.2.3 struct测试71
3.3 数据类型转换72
3.4 运算符73
3.5 Hive表存储格式74
3.6 Hive的其他操作命令75
3.7 Hive分析Tomcat日志案例76
第4章 Hive数据定义79
4.1 数据库的增删改查79
4.1.1 在默认位置创建数据库79
4.1.2 指定目录创建数据库80
4.1.3 显示当前使用的数据库81
4.1.4 删除数据库81
4.2 创建内部表81
4.3 使用关键字external创建外部表83
4.3.1 指定现有目录84
4.3.2 先创建表,再指定目录84
4.3.3 显示某个表或某个分区的信息85
4.4 创建分桶表86
4.5 分区表89
4.5.1 创建和显示分区表89
4.5.2 增加、删除和修改分区90
4.6 显示某张表的详细信息92
4.7 指定输入输出都是SequenceFile类型94
4.8 关于视图94
4.8.1 使用视图降低查询的复杂度94
4.8.2 查看视图的信息95
4.8.3 删除视图95
第5章 Hive数据操作96
5.1 向表中装载数据96
5.2 通过Insert向表中插入数据97
5.3 动态分区插入数据98
5.4 创建表并插入数据100
5.5 导出数据100
第6章 Hive查询103
6.1 SelectFrom语句103
6.2 Select基本查询104
6.3 Where语句105
6.4 Group By语句107
6.5 Join语句108
6.6 排序110
6.6.1 Order By110
6.6.2 Sort By112
6.6.3 Distribute By113
6.6.4 Cluster By114
6.7 抽样查询114
第7章 Hive函数117
7.1 查看系统内置函数117
7.2 常用内置函数117
7.3 Hive的其他函数121
7.3.1 准备数据121
7.3.2 其他函数的使用121
7.3.3 显示某个函数的帮助信息131
7.4 自定义函数132
7.4.1 Hive自定义UDF的过程132
7.4.2 Hive UDTF函数135
第8章 Hive数据压缩138
8.1 数据压缩格式138
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网