您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps
字数: 388000
装帧: 平装
出版社: 清华大学出版社
作者: (美)弗拉德·里斯库蒂亚
出版日期: 2024-04-01
商品条码: 9787302657637
版次: 1
开本: 32开
页数: 616
出版年份: 2024
定价:
¥98
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
主要内容包括
数据字典和数据治理
数据质量管控、合规和分发
构建自动化管道以提高可靠性
数据摄取、存储和分发
支持生产环境中的数据建模、分析和机器学习
目录
第1章 简介 1
1.1 什么是数据工程 2
1.2 本书读者对象 3
1.3 什么是数据平台 3
1.3.1 数据平台的构成 4
1.3.2 基础设施即代码,无代码基础设施 6
1.4 使用云构建 7
1.4.1 IaaS、PaaS和SaaS 7
1.4.2 网络、存储和计算 7
1.4.3 如何使用Azure 8
1.4.4 与Azure交互 8
1.5 实现Azure数据平台 11
1.6 本章小结 13
第Ⅰ部分 基础设施
第2章 存储 17
2.1 在数据平台中存储数据 18
2.1.1 跨多个数据织物存储数据 19
2.1.2 SSOT 20
2.2 Azure Data Explorer简介 22
2.2.1 部署Azure Data Explorer集群 23
2.2.2 使用Azure Data Explorer 26
2.2.3 解决查询问题 29
2.3 Azure Data Lake Storage简介 30
2.3.1 创建Azure Data Lake Storage账户 30
2.3.2 使用Azure Data Lake Storage 31
2.3.3 集成Azure Data Explorer 32
2.4 数据摄取 34
2.4.1 数据摄取频率 34
2.4.2 加载类型 36
2.4.3 数据重建和重新加载 38
2.5 本章小结 41
第3章 DevOps 43
3.1 什么是DevOps 44
3.2 Azure DevOps简介 47
3.3 部署基础设施 50
3.3.1 导出Azure Resource Manager模板 51
3.3.2 创建Azure DevOps服务连接 54
3.3.3 部署Azure Resource Manager模板 56
3.3.4 理解Azure Pipelines 60
3.4 部署Azure Data Explorer对象和分析 61
3.4.1 使用Azure DevOps市场扩展 63
3.4.2 将所有内容都存储在Git并自动部署所有内容 67
3.5 本章小结 68
第4章 编排 69
4.1 导入Bing COVID-19开放数据集 70
4.2 Azure Data Factory简介 72
4.2.1 设置数据源 73
4.2.2 设置数据接收器 75
4.2.3 设置管道 79
4.2.4 设置触发器 82
4.2.5 使用Azure Data Factory进行编排 84
4.3 Azure Data Factory的DevOps 84
4.3.1 从Git部署Azure Data Factory 87
4.3.2 设置访问控制 88
4.3.3 部署生产环境的Azure Data Factory 90
4.3.4 小结 92
4.4 使用Azure Monitor进行监控 93
4.5 本章小结 95
第Ⅱ部分 具体的工作任务
第5章 数据处理 99
5.1 数据建模技术 100
5.1.1 规范化和反规范化 100
5.1.2 数据仓库 103
5.1.3 半结构化数据 104
5.1.4 小结 107
5.2 身份钥匙环 108
5.3 时间线 113
5.4 应用DevOps以保证数据处理能够按计划可靠地运行 116
5.5 本章小结 127
第6章 数据分析 129
6.1 开发环境和生产环境分离下如何访问数据 130
6.2 设计数据分析的工作流程 136
6.3 让数据科学家能够自助移动数据 144
6.3.1 基本原则和相关背景 145
6.3.2 数据合约 145
6.3.3 管道验证 146
6.3.4 事后分析 150
6.3.5 小结 151
6.4 本章小结 151
第7章 机器学习 153
7.1 训练一个机器学习模型 154
7.1.1 使用scikit-learn训练模型 155
7.1.2 高消费者模型实现 156
7.2 引入Azure Machine Learning 158
7.3 MLOps 167
7.4 机器学习的编排 172
7.5 本章小结 179
第Ⅲ部分 数据治理
第8章 元数据 183
8.1 理解大数据平台中元数据的需求 184
8.2 介绍Azure Purview 186
8.3 维护数据字典 190
8.4 管理数据术语表 196
导入 198
8.4.4 小结 200
8.5 了解Azure Purview的高级功能 200
8.6 本章小结 204
第9章 数据质量 207
9.1 数据测试概述 207
9.2 使用Azure Data Factory进行数据质量检查 214
9.3 扩展数据测试 221
9.4 本章小结 231
第10章 合规 233
10.1 数据分类 234
10.2 将敏感数据变得不那么敏感 237
10.3 访问控制模型 247
10.4 GDPR 和其他考虑因素 256
10.5 本章小结 259
第11章 数据分发 261
11.1 数据分发概述 262
11.2 构建数据API 264
11.3 机器学习模型如何对外提供服务 274
11.4 共享数据进行批量复制 274
11.5 数据共享的很好实践 282
11.6 本章小结 284
附录A Azure服务 285
附录B KQL快速参考 287
附录C 运行代码示例 289
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网