您好,欢迎来到聚文网。 登录 免费注册
数据质量管理 数据可靠性与数据质量问题解决之道

数据质量管理 数据可靠性与数据质量问题解决之道

  • 字数: 350000
  • 装帧: 平装
  • 出版社: 机械工业出版社
  • 作者: (美)巴尔·摩西,(美)利奥·加维什,(美)莫莉·沃尔维克
  • 出版日期: 2024-05-01
  • 商品条码: 9787111754114
  • 版次: 1
  • 开本: 16开
  • 页数: 276
  • 出版年份: 2024
定价:¥109 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
你的产品仪表盘看起来时髦吗?你的季度报告过时了吗?你使用的数据集是坏的还是根本就是错误的?这些问题几乎影响每一个团队,但它们通常以一种临时的、被动的方式得到解决。如果你也受困于这些问题,那么本书就是为你准备的。 如今,许多数据工程团队都面临着“好管道,坏数据”的问题。如果你的数据不好,那么数据基础设施再优选也没用。在本书中,来自数据可观测性公司蒙特卡罗的Barr Moses、Lior Gavish和Molly Vorwerck解释了如何利用世界上一些拥有创新性的公司采用的很好实践和技术来解决大规模数据质量和信任问题。 通过阅读本书,你将: ? 构建更可信、更可靠的数据管道。 ? 编写脚本进行数据检查,并通过数据可观测性识别损坏的管道。 ? 了解如何设置和维护数据SLA、SLI和SLO。 ? 制定并领导公司的数据质量计划。 ? 了解如何像对待生产软件一样对待数据服务和系统。 ? 跨数据生态系统自动绘制数据沿袭图。 ? 为关键数据资产构建异常检测器。
内容简介
你的产品仪表盘看起来时髦吗?你的季度报告过时了吗?你使用的数据集是坏的还是根本就是错误的?这些问题几乎影响每一个团队,但它们通常以一种临时的、被动的方式得到解决。如果你也受困于这些问题,那么本书就是为你准备的。
如今,许多数据工程团队都面临着“好管道,坏数据”的问题。如果你的数据不好,那么数据基础设施再优选也没用。在本书中,来自数据可观测性公司蒙特卡罗的Barr Moses、Lior Gavish和Molly Vorwerck解释了如何利用世界上一些拥有创新性的公司采用的很好实践和技术来解决大规模数据质量和信任问题。
通过阅读本书,你将:
构建更可信、更可靠的数据管道。
编写脚本进行数据检查,并通过数据可观测性识别损坏的管道。
了解如何设置和维护数据SLA、SLI和SLO。
制定并领导公司的数据质量计划。
了解如何像对待生产软件一样对待数据服务和系统。
跨数据生态系统自动绘制数据沿袭图。
为关键数据资产构建异常检测器。
目录
前言1
第1章为什么数据质量值得关注7
1.1什么是数据质量9
1.2构筑当下10
1.2.1了解“数据宕机的增加”11
1.2.2促成当前形势的其他行业趋势13
1.3总结15
第2章对可靠数据系统的构建模块进行组装16
2.1了解事务型数据和分析型数据之间的差异16
2.2是什么让它们有所不同17
2.3数据仓库与数据湖19
2.3.1数据仓库:模式级别的表类型19
2.3.2数据湖:文件级别的操作21
2.3.3什么是湖仓一体22
2.3.4在仓库和湖之间同步数据23
2.4收集数据质量指标24
2.4.1什么是数据质量指标24
2.4.2如何提取数据质量指标25
2.4.3使用查询日志了解数据仓库中的数据质量31
2.4.4使用查询日志了解数据湖中的数据质量32
2.5设计数据目录33
2.6构建数据目录34
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网