您好,欢迎来到聚文网。 登录 免费注册
开源大数据分析引擎Impala实战

开源大数据分析引擎Impala实战

  • 字数: 557000.0
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 作者: 贾传青 著 著
  • 出版日期: 2015-03-01
  • 商品条码: 9787302390022
  • 版次: 1
  • 开本: 16开
  • 页数: 329
  • 出版年份: 2015
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
《开源大数据分析引擎Impala实战》内容Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala1.0版比原来基于MapReduce的HiveSQL查询速度提升3~90倍,因此,Impala有可能完全取代Hive。作者基于自己在本职工作中应用Impala的实践和心得编写了《开源大数据分析引擎Impala实战》。《开源大数据分析引擎Impala实战》共分10章,全面介绍开源大数据分析引擎Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。
作者简介
贾传青,数据架构师,Oracle OCM,DB2迁移之星,TechTarget特约作家,从数据库向大数据转型的先行者。曾服务于中国联通、中国电信、建设银行、PICC等,目前供职于一家大数据解决方案提供商,致力于使用大数据技术解决传统数据库无法解决的问题。
目录
第1章Impala概述、安装与配置
1.1 Impala概述
1.2 ClouderaManager安装准备
1.3 CM及CDH安装
1.4 Hive安装
1.5 Impala安装
第2章 Impala入门示例
2.1 数据加载
2.2 数据查询
2.3 分区表
2.4 外部分区表
2.5 笛卡尔连接
2.6 更新元数据
第3章 Impala概念及架构
3.1 Impala服务器组件
3.1.1 Impala Daemon
3.1.2 Impala Statestore
3.1.3 Impala CatalOg
3.2 Impala应用编程
3.2.1 ImpalaSQL方言
3.2.2 Impala编程接口概述
3.3 与Hadoop生态系统集成
3.3.1 与Hive集成
3.3.2 与HDFS集成
3.3.3 使用HBase
第4章SQL语句
4.1 注释
4.2 数据类型
4.2.1 BIGINT
4.2.2 BOOLEAN
4.2.3 DOUBLE
4.2.4 FLOAT
4.2.5 INT
4.2.6 REAL
4.2.7 SMALLINT
4.2.8 STRING
4.2.9 TIMESTAMP
4.2.10 TINYINT
4.3 常量
4.3.1 数值常量
4.3.2 字符串常量
4.3.3 布尔常量
4.3.4 时间戳常量
4.3.5 NULL
4.4 SQL操作符
4.4.1 BETWEEN操作符
4.4.2 比较操作符
4.4.3 IN操作符
4.4.4 IS NULL操作符
4.4.5 LIKE操作符
4.4.6 REGEXP操作符
4.5 模式对象和对象名称
4.5.1 别名
4.5.2 标示符
4.5.3 数据库
4.5.4 表
4.5.5 视图
4.5.6 函数
4.6 SQL语句
4.6.1 ALTER TABLE
4.6.2 ALTER VIEW
4.6.3 COMPUTE STATS
4.6.4 CREATE DATABASE
4.6.5 CREATE FUNCT10N
4.6.6 CREATE TABLE
4.6.7 CREATE VIEW
4.6.8 DESCRIBE
4.6.9 DROP DATABASE
4.6.10 DROP FUNCTION
4.6.11 DROP TABLE
4.6.12 DROP VIEW
4.6.13 EXPLAIN
4.6.14 INSERT
4.6.15 INVALIDATEMETADATA
4.6.16 LOAD DATA
4.6.17 REFRESH
4.6.18 SELECT
4.6.19 SHOW
4.6.20 USE
4.7 内嵌函数
4.7.1 数学函数
4.7.2 类型转换函数
4.7.3 时间和日期函数
4.7.4 条件函数
4.7.5 字符串函数
4.7.6 特殊函数
4.8 聚集函数
4.8.1 AVG
4.8.2 COUNT
4.8.3 GROUP CONCAT
4.8.4 MAX
4.8.5 MIN
4.8.6 NDV
4.8.7 SUM
4.9 用户自定义函数UDF
4.9.1 UDF概念
4.9.2 安装UDF开发包
4.9.3 编写UDF
4.9.4 编写UDAF
4.9.5 编译和部署UDF
4.9.6 UDF性能
4.9.7 创建和使用UDF示例
4.9.8 UDF安全
4.9.9 ImpalaUDF的限制
4.10 Impala SQL &Hive QL
4.11 将SQL移植到Impala上
第5章 Impala shell
5.1 命令行选项
5.2 连接到Impalad
5.3 运行命令
5.4 命令参考
5.5 查询参数设置
第6章 Impala管理
6.1 准入控制和查询队列
6.1.1 准入控制概述
6.1.2 准入控制和YARN
6.1.3 并发查询限制
6.1.4 准入控制和Impala客户端协同工作
6.1.5 配置准入控制
6.1.6 使用准入控制指导原则
6.2 使用YARN资源管理(CDH5)
6.2.1 Llama进程
6.2.2 检查计算的资源和实际使用的资源
6.2.3 资源限制如何生效
6.2.4 启用Impala资源管理
6.2.5 资源管理相关impala—shell参数
6.2.6 Impala资源管理的限制
6.3 为进程,查询,会话设定超时限制
6.4 通过代理实现Impala高可用性
6.5 管理磁盘空间
第7章 Impala存储
……
第8章 Impala分区
第9章 Impala性能优化
第10章 Impala设计原则与应用案例

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网