您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
大数据技术体系详解
装帧: 平装
出版社: 机械工业出版社
作者: 董西成 著
出版日期: 2018-03-01
商品条码: 9787111590729
版次: 1
开本: 16开
页数: 361
出版年份: 2018
定价:
¥79
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书站在大数据落地应用的角度,系统阐述大数据从数据收集,到数据存储、分布式协调及资源管理、计算引擎、分析工具,再到数据可视化这一完整流程,本书既包含主要技术的实现原理及其框架,也包含了具体落地指导,是帮助企业和个人整体了解大数据框架的参考书。本章主要包括6个部分共16章的内容,其中:第壹部分介绍了大数据体系架构,以及Google和Hadoop技术栈;第二部分介绍大数据分析相关技术,主要涉及关系型数据收集工具Sqoop与Canel、非关系型数据收集系统Flume以及分布式消息队列Kafka;第三部分介绍大数据存储相关技术,涉及数据存储格式、分布式文件系统以及分布式数据库;第四部分介绍资源管理和服务协调相关技术,涉及资源管理和调度系统YARN以及资源协调系统ZooKeeper;第五部分介绍计算引擎相关技术,涉及批处理、交互式处理以及流式实时处理三类引擎;第六部分数据分析相关技术,涉及基于数据分析语言HQL与SQL、大数据统一编程模型及机器学习库等。
作者简介
董西成,资历大数据技术实践者和研究者,对大数据基础架构有很好深刻的认识和理解,有着丰富的实践经验。熟悉常见的开源大数据解决方案,包括Hadoop和spark生态系统等,擅长底层分布式系统的优化和开发。撰写了大量Had00p和spark等大数据相关的技术文章并分享在自己的博客上,由于文章技术含量高,所以很好受欢迎。
目录
前言
第一部分概述篇
第1章企业级大数据技术体系概述2
1.1大数据系统产生背景及应用场景2
1.1.1产生背景2
1.1.2常见大数据应用场景3
1.2企业级大数据技术框架5
1.2.1数据收集层6
1.2.2数据存储层7
1.2.3资源管理与服务协调层7
1.2.4计算引擎层8
1.2.5数据分析层9
1.2.6数据可视化层9
1.3企业级大数据技术实现方案9
1.3.1Google大数据技术栈10
1.3.2Hadoop与Spark开源大数据技术栈12
1.4大数据架构:LambdaArchitecture15
1.5Hadoop与Spark版本选择及安装部署16
1.5.1Hadoop与Spark版本选择16
1.5.2Hadoop与Spark安装部署17
1.6小结18
1.7本章问题18
第二部分数据收集篇
第2章关系型数据的收集20
2.1Sqoop概述20
2.1.1设计动机20
2.1.2Sqoop基本思想及特点21
2.2Sqoop基本架构21
2.2.1Sqoop1基本架构22
2.2.2Sqoop2基本架构23
2.2.3Sqoop1与Sqoop2对比24
2.3Sqoop使用方式25
2.3.1Sqoop1使用方式25
2.3.2Sqoop2使用方式28
2.4数据增量收集CDC31
2.4.1CDC动机与应用场景31
2.4.2CDC开源实现Canal32
2.4.3多机房数据同步系统Otter33
2.5小结35
2.6本章问题35
第3章非关系型数据的收集36
3.1概述36
3.1.1Flume设计动机36
3.1.2Flume基本思想及特点37
3.2FlumeNG基本架构38
3.2.1FlumeNG基本架构38
3.2.2FlumeNG高级组件41
3.3FlumeNG数据流拓扑构建方法42
3.3.1如何构建数据流拓扑42
3.3.2数据流拓扑实例剖析46
3.4小结50
3.5本章问题50
第4章分布式消息队列Kafka51
4.1概述51
4.1.1Kafka设计动机51
4.1.2Kafka特点53
4.2Kafka设计架构53
4.2.1Kafka基本架构54
4.2.2Kafka各组件详解54
4.2.3Kafka关键技术点58
4.3Kafka程序设计60
4.3.1Producer程序设计61
4.3.2Consumer程序设计63
4.3.3开源Producer与Consumer实现65
4.4Kafka典型应用场景65
4.5小结67
4.6本章问题67
第三部分数据存储篇
第5章数据序列化与文件存储格式70
5.1数据序列化的意义70
5.2数据序列化方案72
5.2.1序列化框架Thrift72
5.2.2序列化框架Protobuf74
5.2.3序列化框架Avro76
5.2.4序列化框架对比78
5.3文件存储格式剖析79
5.3.1行存储与列存储79
5.3.2行式存储格式80
5.3.3列式存储格式ORC、Parquet与CarbonData82
5.4小结88
5.5本章问题89
第6章分布式文件系统90
6.1背景90
6.2文件级别和块级别的分布式文件系统91
6.2.1文件级别的分布式系统91
6.2.2块级别的分布式系统92
6.3HDFS基本架构93
6.4HDFS关键技术94
6.4.1容错性设计95
6.4.2副本放置策略95
6.4.3异构存储介质96
6.4.4集中式缓存管理97
6.5HDFS访问方式98
6.5.1HDFSshell98
6.5.2HDFSAPI100
6.5.3数据收集组件101
6.5.4计算引擎102
6.6小结102
6.7本章问题103
第7章分布式结构化存储系统104
7.1背景104
7.2HBase数据模型105
7.2.1逻辑数据模型105
7.2.2物理数据存储107
7.3HBase基本架构108
7.3.1HBase基本架构108
7.3.2HBase内部原理110
7.4HBase访问方式114
7.4.1HBaseshell114
7.4.2HBaseAPI116
7.4.3数据收集组件118
7.4.4计算引擎119
7.4.5ApachePhoenix119
7.5HBase应用案例120
7.5.1社交关系数据存储120
7.5.2时间序列数据库OpenTSDB122
7.6分布式列式存储系统Kudu125
7.6.1Kudu基本特点125
7.6.2Kudu数据模型与架构126
7.6.3HBase与Kudu对比126
7.7小结127
7.8本章问题127
第四部分分布式协调与资源管理篇
第8章分布式协调服务ZooKeeper130
8.1分布式协调服务的存在意义130
8.1.1leader选举130
8.1.2负载均衡131
8.2ZooKeeper数据模型132
8.3ZooKeeper基本架构133
8.4ZooKeeper程序设计134
8.4.1ZooKeeperAPI135
8.4.2ApacheCurator139
8.5ZooKeeper应用案例142
8.5.1leader选举142
8.5.2分布式队列143
8.5.3负载均衡143
8.6小结144
8.7本章问题145
第9章资源管理与调度系统YARN146
9.1YARN产生背景146
9.1.1MRv1局限性146
9.1.2YARN设计动机147
9.2YARN设计思想148
9.3YARN的基本架构与原理149
9.3.1YARN基本架构149
9.3.2YARN高可用152
9.3.3YARN工作流程153
9.4YARN资源调度器155
9.4.1层级队列管理机制155
9.4.2多租户资源调度器产生背景156
9.4.3Capacity/FairScheduler157
9.4.4基于节点标签的调度160
……
16.4本章问题
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网