您好,欢迎来到聚文网。 登录 免费注册
数据湖仓

数据湖仓

“数据仓库之父”比尔·恩门作品,数据湖仓构建指南
  • 字数: 88000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 作者: (美)比尔·恩门,(美)戴夫·拉皮恩,(美)瓦莱丽·巴特尔特 著 上海市静安区国际数据管理协会 译
  • 商品条码: 9787115638885
  • 版次: 1
  • 开本: 32开
  • 页数: 180
定价:¥49.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
1.本书的一作为比尔·恩门,被誉为“数据仓库之父”,先提出数据仓库概念的学者,在数据库技术管理与数据库设计方面拥有超过35年的经验。 2.本书由国际专业的数据管理专业团体DAMA中国团队翻译。 3.本书涵盖数据湖仓的多个主题,包括基本概念、应用领域和案例分析等,内容丰富多样,语言易懂简洁,能够满足不同领域读者的需求。 4.本书不仅介绍数据湖仓构建的理论知识,而且包含非常有趣的案例分析,可以帮助读者更好地理解理论知识在实际问题中的应用。
内容简介
数据湖仓是下一代数据仓库和数据湖,旨在满足复杂多变的现代信息系统的需求。本书主要展示了如何构建作为人工智能、机器学习和数据网格的基础的数据湖仓,同时介绍了数据湖仓的缺陷和使用技巧,以最大限度地提高数据湖仓的商业价值。
在本书中,我们将深入探讨数据湖仓的核心特性及其成功的关键因素。首先,我们将认识到数据质量的重要性,并通过检查输入错误、解决键的非兼容性问题以及维护良好的文档编制来提高数据的质量和可信度。其次,我们将学习数据湖仓的不同存储类型,包括未充分利用但极具价值的大容量存储器。我们也将针对数据湖仓中的3种主要数据类型——结构化数据、文本数据和模拟/物联网数据,学习如何为人工智能、机器学习和数据网格构建坚实的基础。同时,我们将探讨如何利用针对结构化数据的数据模型、针对文本数据的本体和分类标准,以及针对模拟/物联网数据的数据蒸馏算法,来抽象化这些数据,以满足未来的业务需求。最后,我们将学习如何应用ETL技术解决数据转换问题,确保构建一个高效、满足业务需求的数据湖仓。
作者简介
比尔·恩门 比尔·恩门被誉为“数据仓库之父”,出版了60本书并被译为多种语言,《计算机世界》将他评为计算机专业历史上具影响力的十大人物之一。 戴夫·拉皮恩 戴夫·拉皮恩是辛辛那提大学林德纳商学院的副教授,有着超过25年的教学经验,还开发和管理了许多不同行业的大规模数据集成系统。 瓦莱丽·巴特尔特 瓦莱丽·巴特尔特在印第安纳大学凯利商学院获得信息系统博士学位和商业硕士学位,并且在电信学院获得了沉浸式媒介环境硕士学位。
目录
第1章让数据可信1
1.1做一个成熟的端用户2
1.2不断攀升的可信目标5
1.3可信数据的要素7
1.4小结8
第2章基础数据9
2.1构建应用程序9
2.2以人工智能医疗为例10
2.3基础数据的组成要素12
2.4小结14
第3章如何避不良数据15
3.1输入错误16
3.2键的问题18
3.3重复记录18
3.4拼写错误19
3.5兼容性19
3.6编制文档21
3.7小结22
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网