您好,欢迎来到聚文网。 登录 免费注册
构建数据湖仓

构建数据湖仓

  • 字数: 184000
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 作者: (美)比尔·恩门,(美)玛丽·莱文斯,(美)兰吉特·斯里瓦斯塔瓦
  • 出版日期: 2023-03-01
  • 商品条码: 9787302624479
  • 版次: 1
  • 开本: 16开
  • 页数: 192
  • 出版年份: 2023
定价:¥68 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
超越数据库与数据湖,新一代数据管理的新模式——数据湖仓为数据分析带来新变革,为更有效、更便捷、更科学、更可靠、更灵活的数据分析提供基础。
内容简介
在数据湖仓的所有新增要素中,排名第一的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、数据体量的度量、数据创建的历史记录、数据转换描述。数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规划。
作者简介
胡博,国际数据管理协会(DAMA)中国理事,国家重点研发计划课题负责人。发表过学术论文20余篇,在云平台、数据中台等方面授权国家发明专利12项;是中国计算机学会高级会员、中国计算机协会服务计算专委会执行委员、SCI期刊IJWSR 执行主编、华中农业大学、深圳大学、武汉科技大学和海南师范大学硕士生导师。
目录
引言
第一章向数据湖仓演进
1.技术的演进
2.组织内的全部数据
3.商业价值在哪里?
4.数据湖
5.当前数据架构的挑战
6.数据湖仓的出现
第二章数据科学家和终端用
1.数据湖
2.分析基础设施
3.不同的受众
4.分析工具不同
5.分析目的不同
6.分析方法不同
7.数据类型不同
第三章数据湖仓中的不同类型数据
1.数据的类型
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网