您好,欢迎来到聚文网。 登录 免费注册
Greenplum 构建实时数据仓库实践

Greenplum 构建实时数据仓库实践

  • 字数: 576000
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 作者: 王雪迎
  • 出版日期: 2022-08-01
  • 商品条码: 9787302611653
  • 版次: 1
  • 开本: 16开
  • 页数: 360
  • 出版年份: 2022
定价:¥89 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
"本书详解Greenplum构建实时数据仓库,涉及的具体技术包括: MySQL主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。 Canal Server实时获取增量MySQL binlog,并将其传入Kafka消息队列。 Kafka将消息持久化,同时提供可伸缩、高吞吐的消息服务。 Canal ClientAdapter负责消费Kafka中的消息,将数据流传输到Greenplum。 Greenplum提供实时ETL功能,自动维护操作数据存储、维度表与事实表。 Greenplum数据库权限与角色管理、数据导入导出、性能优化、监控与维护。 Greenplum集成机器学习库MADlib,对数据进行分析与挖掘。"
内容简介
Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。
本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。
本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
作者简介
王雪迎 ,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。
目录
第1章数据仓库简介
1.1什么是数据仓库
1.1.1数据仓库的定义
1.1.2建立数据仓库的原因
1.2操作型系统与分析型系统
1.2.1操作型系统
1.2.2分析型系统
1.2.3操作型系统和分析型系统的对比
1.3抽取一转换一装载
1.3.1数据抽取
1.3.2数据转换
1.3.3数据装载
1.3.4开发ETL系統的方法
1.4数据仓库架构
1.4.1基本架构
1.4.2主要数据仓库架构
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网