您好,欢迎来到聚文网。 登录 免费注册
Doris实时数据仓库理论与实战/架构师前沿实战丛书

Doris实时数据仓库理论与实战/架构师前沿实战丛书

  • 字数: 546
  • 出版社: 清华大学
  • 作者: 编者:吴百豹|
  • 商品条码: 9787302662686
  • 版次: 1
  • 开本: 16开
  • 页数: 302
  • 出版年份: 2024
  • 印次: 1
定价:¥109 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书系统地介绍了Doris 的核心概念、架构原理和各 项功能。全书共7章。第1章 对Doris做了初步介绍。第2 章重点介绍了Doris的数据 表设计。第3章聚焦于Doris 的数据导入。第4章介绍了 Doris的数据导出和数据管 理。第5章讨论了Doris中的 数据更新和删除操作。第6 章将读者带入Doris的进阶 使用领域。第7章展示了 Doris的生态扩展。通过本 书的学习,读者可以全面而 深入地了解运用Doris构建 高效、可扩展、实时数据仓 库系统的方法,从理论到实 践,从基础到进阶。 本书适用于Doris开发人 员和数据工程师,或有志从 事数据仓库开发的技术人员 。
作者简介
吴百豹,从事大数据研发多年,负责项目需求分析,平台搭建,业务开发流程设计,项目整体管理把控等工作。精通Hadoop、Spark、Flink等大数据技术栈各类技术实战应用,精通大数据离线、实时数仓架构、中台方法论及实战设计,对分布式集群技术选型、离线、实时处理场景架构设计、机器学习算法有深入研究。主导开发国家水资源大数据平台、中国银行风控数据中心等大型国家级项目。
目录
第1章 初识Doris 1.1 Doris概述 1.2 Doris的应用场景 1.2.1 报表分析 1.2.2 即席查询(Ad-Hoc Query) 1.2.3 统一数仓构建 1.2.4 数据湖联邦查询 1.3 Doris的架构原理 1.4 Doris的特点 1.4.1 支持标准SQL接口 1.4.2 列式存储引擎 1.4.3 支持丰富的索引结构 1.4.4 支持多下册种存储模型 1.4.5 支持物化视图 1.4.6 MPP架构设计 1.4.7 支持向量化查询引擎 1.4.8 动态调整执行计划 1.4.9 采用CBO和RBO查询优化器 1.5 Doris部署 1.5.1 开发测试环境/生产配置建议 1.5.2 Broker部署介绍 1.5.3 操作系统安装要求 1.5.4 网络需求 1.6 Doris分布式部署 1.6.1 Doris下载 1.6.2 节点划分 1.6.3 节点配置 1.6.4 FE部署及启动 1.6.5 FE扩缩容 1.6.6 BE部署及启动 1.6.7 BE扩缩容 1.6.8 Broker部署(可选) 1.6.9 Doris集群启停脚本 第2章 Doris数据表设计 2.1 Doris简单使用 2.1.1 创建用户 2.1.2 创建数据库 2.1.3 账户赋权 2.1.4 创建数据表 2.1.5 查询数据表 2.2 DOH‘s基础 2.2.1 建表语法及参数解释 2.2.2 数据类型 2.3 数据存储模型基础 2.3.1 Aggregate数据存储模型 2.3.2 Unique数据存储模型 2.3.3 Duplicate数据存储模型 2.3.4 聚合模型的局限性 213.5 数据模型的选择建议 2.4 列定义建议 2.5 分区和分桶基础 2.5.1 分区 2.5.2 分桶 2.5.3 复合分区使用场景 2.6 Properties配置项 2.7 关于ENGINE 2.8 Doris索引 2.8.1 前缀索引 2.8.2 Bitmap索引 2.8.3 Bloom Filter索引 2.9 Rollup物化索引 2.9.1 Rollup物化索引的创建与操作 2.9.2 Rollup物化索引的作用 第3章 Doris数据导入 3.1 Insert Into 3.1.1 语法及参数 3.1.2 案例 3.2 Binlog Load 3.2.1 基本原理 3.2.2 canal原理及配置 3.2.3 Doris同步MySQL数据案例 3.2.4 注意事项 3.3 Broker Load 3.3.1 基本原理 3.3.2 Broker Load语法 3.3.3 案例 3.3.4 注意事项 3.4 HDFS Load 3.5 Spark Load 3.5.1 基本原理 3.5.2 Spark集群搭建 3.5.3 Doris配置Spark与Yam 3.5.4 Doris创建Spark Resource 3.5.5 Spark Load语法和结果 3.5.6 Spark Load导入HDFS数据 3.5.7 使用Spark Load导入Hive数据 3.5.8 注意事项 3.6 Routine Load 3.6.1 Routine Load语法 3.6.2 严格模式 3.6.3 案例 3.6.4 注意事项 3.7 Stream Load 3.7.1 基本原理 3.7.2 语法与结果 3.7.3 开启Steam Load记录 3.7.4 案例 3.7.5 注意事项 3.8 通过外部表同步数据到Doris 3.9 总结 第4章 Doris数据导出及数据管理 4.1 Export导出 4.1.1 导出原理 4.1.2 Export语法和结果 4.1.3 Doris数据导出到HDFS案例 4.1.4 注意事项 4.2 Select…into outfile导出 4.2.1 Select…into outfile语法和结果 4.2.2 Doris数据导出到HDFS案例 4.2.3 Doris数据导出到本地案例 4.2.4 注意事项 4.3 MySQL dump导出 4.3.1 dump导出案例 4.3.2 注意事项 4.4 BACKUP数据备份 4.4.1 BACKUP原理 4.4.2 BACKUP语法 4.4.3 BACKUP数据备份案例 4.4.4 注意事项 4.5 RESTORE数据恢复 4.5.1 RESTORE数据恢复原理 4.5.2 RESTORE数据恢复语法 4.5.3 RESTORE数据恢复案例 4.5.4 注意事项 4.6 RECOVER数据删除恢复 4.6.1 RECOVER语法 4.6.2 数据恢复案例 第5章 Doris数据更新与删除 5.1 Update数据更新 5.1.1 Update原理 5.1.2 Update数据更新案例 5.1.3 Update使用注意事项 5.2 Delete数据删除 5.2.1 Delete语法 5.2.2 Delete删除返回结果 5.2.3 Delete删除案例 5.2.4 Delete相关配置 5.3 Sequence列 5.3.1 基本原理 5.3.2 使用语法 5.3.3 Sequence列使用案例 5.4 批量删除 5.4.1 批量删除原理 5.4.2 批量删除案例 第6章 Doris进阶 6.1 表结构变更 6.1.1 Schema Change 6.1.2 替换表 6.2 动态分区 6.2.1 动态分区使用及参数 6.2.2 创建历史分区规则 6.2.3 动态分区案例 6.2.4 查看动态分区表调度情况 6.2.5 动态分区注意点 6.3 数据缓存 6.3.1 SQLCache 6.3.2 PartitionCache 6.3.3 缓存使用方式 6.3.4 优化参数

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网