您好,欢迎来到聚文网。 登录 免费注册
Effective数据科学基础设施(数据科学与大数据技术)

Effective数据科学基础设施(数据科学与大数据技术)

  • 字数: 427
  • 出版社: 清华大学
  • 作者: (芬)维莱·图洛斯|责编:王军|译者:郭涛
  • 商品条码: 9787302641865
  • 版次: 1
  • 开本: 16开
  • 页数: 277
  • 出版年份: 2023
  • 印次: 1
定价:¥98 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
数据科学项目日益增多,每个项目在提出原型 到生产的过程中都需要可靠的基础设施。使用 《Effective数据科学基础设施》介绍的一些新技 术和新工具,你将能建立一个适用于各类组织(无论 是初创企业还是大型企业)的基础设施堆栈。 《Effective数据科学基础设施》可帮助你建 立数据流程和项目工作流,为你开发项目带来强大 动力。《Effective数据科学基础设施》呈现 Netflix数据操作的最先进工具和概念,并在此基 础上介绍一种可定制的基于云的模型开发和MLOps方 法,可轻松适应公司的特定需求。当团队把数据科 学和机器学习应用于广泛的业务问题时,这些实用 的数据流程将更高效地生成更完美的结果。 主要内容 在云中处理计算和编排 将基于云的工具耦合到一个内聚的数据科学环 境中 使用Metaflow、AWS和Python数据生态系统开 发可复制的数据科学项目 构建需要大型数据集和模型,需要数据科学家 团队参与的复杂应用程序
目录
第1章 数据科学基础设施介绍 1.1 选择数据科学基础设施的原因 1.2 什么是数据科学基础设施 1.2.1 数据科学基础设施堆栈 1.2.2 支持数据科学项目的整个生命周期 1.2.3 不能以偏概全 1.3 良好基础设施的重要性 1.3.1 管理复杂性 1.3.2 利用现有平台 1.4 以人为中心的基础设施 1.4.1 自由与责任 1.4.2 数据科学家自主性 1.5 本章小结 第2章 数据科学的工具链 2.1 建立开发环境 2.1.1 云账户 2.1.2 数据科学工作站 2.1.3 笔记 2.1.4 归纳 2.2 介绍工作流 2.2.1 工作流基础 2.2.2 执行工作流 2.2.3 工作流框架 2.3 本章小结 第3章 Metaflow简介 3.1 Metaflow的基本概念 3.1.1 安装Metaflow 3.1.2 编写基本工作流 3.1.3 管理工作流中的数据流 3.1.4 参数 3.2 分支和合并 3.2.1 有效的DAG结构 3.2.2 静态分支 3.2.3 动态分支 3.2.4 控制并发 3.3 Metaflow实际应用 3.3.1 启动新项目 3.3.2 使用客户端API访问结果 3.3.3 调试故障 3.3.4 最后润色 3.4 本章小结 第4章 随计算层伸缩 4.1 什么是可伸缩性 4.1.1 整个堆栈的可伸缩性 4.1.2 实验文化 4.2 计算层 4.2.1 使用容器进行批处理 4.2.2 计算层示例 4.3 Metaflow中的计算层 4.3.1 为Metaflow配置AWS批处理

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网