您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Hadoop理论与实践
字数: 276000
装帧: 平装
出版社: 清华大学出版社
出版日期: 2021-01-01
商品条码: 9787302559504
版次: 1
开本: 16开
页数: 232
出版年份: 2021
定价:
¥58
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
"《Hadoop理论与实践》对 Hadoop 的架构、原理和生态系统组成进行了详细的解读,结构清晰,对于需要详细了解和应用 Hadoop 的读者是一个不错的选择。 《Hadoop理论与实践》是北京百里半网络技术有限公司所编著的“大数据人工智能系列丛书”中的一本,它为该系列的其他几本专业教材提供了大数据入门的支撑。 《Hadoop理论与实践》凝聚了编委会多年来的教学经验和成果,内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论和实践相结合,可作为各类高等院校教材,也可供广大程序设计人员参考。"
内容简介
《Hadoop理论与实践/大数据人工智能系列丛书》按照高等学校大数据、人工智能课程基本要求,以案例驱动的形式来组织内容,突出该课程的实践性特点。
《Hadoop理论与实践/大数据人工智能系列丛书》主要包含四大部分:Hadoop技术、数据仓库与Hive、Flume分布式日志处理系统、Spark及其生态圈概述。其中,Hadoop技术包括大数据与数据分析、Hadoop生态系统介绍、Hadoop存储、Hadoop计算之MapReduce、Hadoop安全等;数据仓库与Hive包括Hive与数据库的基础知识、Hive的高级特性、Hive优化及案例的应用;Flume分布式日志处理系统包括Flume介绍、Flume使用案例及Flume开发案例的应用;Spark及其生态圈概述包括Spark简介及Spark生态系统详解。
《Hadoop理论与实践/大数据人工智能系列丛书》内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论与实践的结合,可作为各类高等院校人工智能与大数据相关专业的教材,也可供广大程序设计人员参考。
作者简介
李平,男,1981年出生,工学博士,任教于黄冈师范学院数学与统计学院。主要研究方向为大数据技术与应用、数学建模等,有丰富的高校教学经验与企业实践经历,发表科研论文十余篇,主持参与省部级科研项目三项,多次指导本专科学生及研究生参加数据挖掘竞赛、数学建模竞赛并获得重量奖项。
目录
第1章 大数据概述 1
1.1 大数据与数据分析 2
1.1.1 Hadoop的基础组件 2
1.1.2 Hadoop分布式文件系统 3
1.1.3 MapReduce 3
1.1.4 YARN 4
1.2 ZooKeeper 5
1.3 Hive 6
1.4 与其他系统集成 7
1.4.1 Hadoop生态系统 7
1.4.2 数据集成与Hadoop 8
1.4.3 Hadoop商用平台CDH 9
第2章 Hadoop存储 13
2.1 HDFS的基础知识 14
2.1.1 HDFS概念 14
2.1.2 架构 18
2.1.3 接口 21
2.2 在分布式模式下设置HDFS集群 26
2.3 HDFS的高级特性 30
2.3.1 快照 30
2.3.2 离线查看器 33
2.3.3 分层存储 39
2.4 文件格式 42
2.5 云存储 43
第3章 数据仓库和Hive 45
3.1 数据仓库和Hive简介 45
3.1.1 数据仓库简介 45
3.1.2 数据仓库与数据库的区别 46
3.1.3 Hive简介 46
3.1.4 查看CDH中Hive版本 47
3.2 Hive与数据库 48
3.2.1 Hive与RDBMS 48
3.2.2 HiveQL与SQL 50
3.3 Hive的高级特性 51
3.3.1 Hive的优缺点和适用场景 52
3.3.2 Hive进程介绍 52
3.3.3 Hive访问方式 53
3.3.4 Hive体系结构 53
3.3.5 Hive Metastore 55
3.3.6 Hive数据类型 56
3.3.7 Hive的常用参数配置 57
3.3.8 Hive的数据模型 58
3.3.9 Hive函数 62
3.4 案例演示 66
3.4.1 准备数据 67
3.4.2 修改和查询 71
3.4.3 表连接 72
3.4.4 创建视图 74
3.4.5 创建索引 75
3.4.6 JDBC开发 76
3.4.7 UDF的开发 84
3.4.8 UDAF 86
3.5 Hive优化和Hive中的锁 87
3.5.1 注意事项 87
3.5.2 Hive锁 88
3.6 问题汇总 89
第4章 Hadoop计算 91
4.1 Hadoop MapReduce的基础 91
4.1.1 概念 92
4.1.2 架构 94
4.2 启动MapReduce作业 99
4.2.1 编写map任务 100
4.2.2 编写reduce任务 102
4.2.3 编写MapReduce作业 103
4.2.4 MapReduce配置 105
4.3 MapReduce的高级特性 106
4.3.1 分布式缓存 106
4.3.2 计数器 108
4.3.3 作业历史服务器 109
第5章 Hadoop安全 113
5.1 提升Hadoop集群安全性 114
5.1.1 边界安全 114
5.1.2 Kerberos认证 115
5.1.3 Hadoop中的服务级授权 120
5.2 提升数据安全性 124
5.2.1 数据分类 125
5.2.2 将数据传到集群 125
5.2.3 保护集群中的数据 130
5.3 增强应用程序安全性 134
5.3.1 YARN 架构 134
5.3.2 YARN中的应用提交 135
第6章 Flume分布式日志处理系统 139
6.1 Flume介绍 139
6.1.1 Flume简介 140
6.1.2 Flume原理 141
6.1.3 Flume特点 143
6.1.4 Flume结构 143
6.1.5 Flume使用 156
6.2 Flume使用案例 159
6.2.1 Flume监听端口示例 159
6.2.2 两个主机组成的Flume集群示例 162
6.2.3 HDFS Sink使用示例 164
6.2.4 扇出示例 167
6.2.5 负载均衡(Sink组)示例 169
6.3 Flume开发案例 178
6.3.1 开发自定义的Sink 178
6.3.2 Flume结合Kafka的使用 183
第7章 Spark及其生态圈概述 203
7.1 Spark 简介 203
7.1.1 什么是Spark 203
7.1.2 Spark与MapReduce比较 206
7.1.3 Spark的演进路线图 206
7.2 Spark生态系统 207
7.2.1 Spark Core 208
7.2.2 Spark Streaming 209
7.2.3 Spark SQL 211
7.2.4 BlinkDB 213
7.2.5 MLBase/MLIib 213
7.2.6 GraphX 214
7.2.7 SparkR 215
7.2.8 Alluxio 216
7.3 小结 217
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网