HADOOP虚拟化--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥22.05

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

编辑推荐

本书的作者是大数据基础设施、VMware软件和数据架构方面的专家，在构建企业数据解决方案有多年的行业经验。本书专门介绍虚拟化Hadoop。现在市面上没有专门介绍Hadoop虚拟化的书。

内容简介

本书旨在帮助读者了解和掌握不同虚拟化Hadoop选择的优缺点、虚拟化Hadoop的配置及其注意事项。本书共分15章，主要内容包括Hadoop平台在企业转型中扮演的重要角色、Hadoop基础概念、YARN与HDFS、现代数据平台、数据采集、Hadoop SQL引擎、Hadoop中的多租户、虚拟化基础、虚拟化Hadoop实践、虚拟化Hadoop、虚拟化Hadoop主服务器、虚拟化Hadoop工作节点、私有云中的Hadoop即服务、Hadoop安装以及Hadoop Linux配置。

作者简介

George J. Trujillo, Jr. 是一名经验丰富且具有高沟通能力的企业高管。他是变革管理专家，具备强大的领导力、批判性思维且善于用数据驱动决策。George在大数据和云解决方案领域是国际公认的数据架构师和讲师。他涉足的领域包括大数据架构、Hadoop（Hortonworks、Cloudera）、数据治理、数据库模式设计、元数据管理、安全、NoSQL和商业智能（BI）。他拥有众多的行业认证，其中包括Oracle双ACE认证、Sun 微系统应用中间平台Sun大使、VMware认可vExpert、VMware认证讲师、MySQL苏格拉底奖获得者和MySQL认证数据库管理员（DBA）。同时，他在用户社区中的领导地位包括Independent Oracle Users Group(IOUG)董事会成员、IOUG Cloud SIG主席、RMOUG Big Data SIG主席、OracleFusion Council和Oracle BetaOracle Beta Leadership Council委员，并被IOUG推选加入“Oracles of Oracle”圈子，同时也是IOUG’s Master Series演讲大师。George的工作职位包含金融服务行业大数据架构副总裁、Hortonworks大数据专家、VMware Center of Excellence以及专业服务和培训组织的CEO。 Charles Kim是Viscosity North America公司总裁，该公司是一家专门从事大数据、Oracle Exadata/RAC和虚拟化的利基咨询机构。Charles是Hadoop大数据、Linux基础架构、云计算、虚拟化、工程化系统和Oracle集群技术方面的架构师。同时，Charles也是Oracle出版社、培生出版集团和Apress出版社Oracle、Hadoop和Linux技术领域的作者。他有Oracle、VMware、Red Hat Linux和Microsoft认证，在关键任务和关键业务系统上有超过23年的IT从业经历。

目录第 1章了解大数据的世界 1 1.1 数据革命 1 1.2 传统数据系统 3 1.2.1 半结构化和非结构化数据 4 1.2.2 因果关系 6 1.2.3 数据挑战 6 1.3 现代数据架构 14 1.4 组织转型 15 1.5 行业转型 17 1.6 小结 17 第 2章 Hadoop基础概念 18 2.1 Hadoop中的数据类型 18 2.2 使用案例 19 2.3 什么是Hadoop 20 2.4 Hadoop发行版本 25 2.5 Hadoop框架 25 2.6 NoSQL数据库 29 2.7 Hadoop集群 33 2.8 Hadoop软件进程 36 2.9 Hadoop生态中的角色 45 2.10 小结 48 第3章 YARN和HDFS 49 3.1 Hadoop分布式集群 49 3.2 Hadoop目录结构 53 3.3 Hadoop分布式文件系统 54 3.3.1 YARN日志 56 3.3.2 NameNode 57 3.3.3 DataNode 58 3.3.4 块分布 60 3.3.5 NameNode配置和元数据管理 62 3.4 机架感知 67 3.4.1 块管理 67 3.4.2 均衡器 68 3.4.3 群集中的数据完整性维护 68 3.4.4 配额和垃圾桶 76 3.5 YARN和YARN处理模型 76 3.5.1 在YARN上运行应用 83 3.5.2 资源调度器 88 3.5.3 基准测试 92 3.5.4 TeraSort基准测试组件 94 3.6 小结 96 第4章现代数据平台 98 4.1 设计一个Hadoop集群 98 4.2 小结 115 第5章数据提取 117 5.1 提取、加载和转化 117 5.1.1 Sqoop：数据移动和SQL源 118 5.1.2 Flume：流数据 123 5.1.3 Oozie：计划和工作流 140 5.1.4 Falcon：数据生命周期管理 145 5.1.5 Kafka：实时数据流 148 5.2 小结 156 第6章 Hadoop SQL引擎 157 6.1 SQL的起源 157 6.2 Hadoop中的SQL 158 6.3 Hadoop SQL引擎 159 6.4 感受Hive和Pig的乐趣 166 6.4.1 Hive 166 6.4.2 HCatalog 180 6.5 小结 187 第7章 Hadoop多租户 188 7.1 保障访问 189 7.1.1 认证 189 7.1.2 审计 194 7.1.3 授权 194 7.1.4 数据保护 196 7.1.5 数据隔离 203 7.1.6 进程隔离 211 7.2 小结 214 第8章虚拟化基础 215 8.1 Hadoop虚拟化的原因 216 8.2 小结 231 参考文献 231 第9章 Hadoop虚拟化很好实践 232 9.1 有目的、有调理地进行Hadoop虚拟化 232 9.1.1 目的始于明确的目标 234 9.1.2 Hadoop不同层次虚拟化 234 9.1.3 行业很好实践 236 9.2 小结 249 第 10章 Hadoop虚拟化 250 10.1 如何管理Hadoop生态 251 10.1.1 构建敏捷和弹性的企业Hadoop平台 252 10.1.2 澄清条款 252 10.1.3 从裸机到虚拟化的历程 253 10.2 为何考虑Hadoop虚拟化 254 10.2.1 Hadoop虚拟化的好处 255 10.2.2 虚拟化可以跟本地运行一样快甚至更快 256 10.2.3 协调和交叉目的专业化是未来 258 10.2.4 障碍可以是在企业之前 259 10.2.5 虚拟化不是全部或不是一个选项 259 10.2.6 快速配置并提高开发和测试环境质量 259 10.2.7 使用虚拟化提升高可用性 261 10.2.8 使用虚拟化处理Hadoop工作负载 261 10.2.9 基于云的Hadoop 262 10.2.10 大数据扩展 262 10.2.11 虚拟化的途径 263 10.2.12 软件定义数据中心 264 10.2.13 虚拟化网络 265 10.2.14 vRealize Suite 266 10.3 小结 267 参考文献 268 第 11章 Hadoop虚拟化主服务器 269 11.1 Hadoop虚拟化集群服务器 269 11.1.1 Hadoop周边环境虚拟化 270 11.1.2 Hadoop主服务器虚拟化 271 11.1.3 无SAN虚拟化 274 11.2 小结 275 第 12章虚拟化工作节点 276 12.1 Hadoop中的工作节点 276 12.2 Hadoop集群的部署模式 277 12.2.1 组合模式 278 12.2.2 分离模式 281 12.2.3 数据-计算分离的网络影响 283 12.2.4 数据-计算分离模式下的共享存储方式 284 12.2.5 用于应用临时数据的本地磁盘 286 12.2.6 使用网络附加存储（NAS）的共享存储架构模型 286 12.2.7 部署模式总结 288 12.3 Hadoop虚拟化工作节点的很好实践 289 12.4 Hadoop虚拟化扩展 293 12.5 小结 296 参考文献 296 资源 297 第 13章私有云中部署Hadoop即服务 298 13.1 云概念 298 13.1.1 Hadoop的受益者 299 13.1.2 解决方案架构概述 303 13.2 小结 305 参考文献 305 第 14章掌握Hadoop的安装 306 14.1 为正确的场景使用正确的解决方案 306 14.2 配置仓库 308 14.2.1 安装HDP2.2 310 14.2.2 环境准备 310 14.3 设置Hadoop配置 320 14.4 启动HDFS和YARN 325 14.4.1 启动YARN 327 14.4.2 验证MapReduce功能 329 14.5 安装和配置Hive 331 14.6 安装和配置MySQL数据库 331 14.7 安装和配置Hive和HCatalog 331 14.8 小结 334 第 15章为Hadoop配置Linux 336 15.1 支持的Linux平台 337 15.2 不同部署模式 337 15.3 Linux黄金模板 337 15.3.1 构建企业级Linux Hadoop平台 338 15.3.2 Linux版本选择 341 15.4 很优Linux内核参数和系统设置 341 15.4.1 epoll 341 15.4.2 禁用交换空间 342 15.4.3 安装过程中的安全性禁用 342 15.4.4 IO调度器调优 344 15.4.5 检查透明大内存页面配置 344 15.4.6 Limits.conf 344 15.4.7 RDM分区对齐 345 15.4.8 文件系统注意事项 345 15.4.9 XFS惰性计算参数 347 15.4.10 Mount选项 347 15.4.11 I/O调度器 348 15.4.12 磁盘读写选项 350 15.4.13 存储基准测试 350 15.4.14 Java版本 351 15.4.15 设置NTP 351 15.4.16 启用巨型帧 352 15.4.17 其他网络方面的考虑 353 15.5 小结 355 附录 Hadoop集群创建：先决条件检查表 356

摘要

DELICACYCONTENTS

HADOOP虚拟化

库存： {{selectedSku?.stock}} 库存充足

上架到店铺