您好,欢迎来到聚文网。 登录 免费注册
数据准备:方法、原理与应用

数据准备:方法、原理与应用

  • 字数: 390
  • 出版社: 高等教育
  • 作者: 编者:李艳//周迎春|总主编:马志明//徐宗本//范剑青
  • 商品条码: 9787040645354
  • 适读年龄: 12+
  • 版次: 1
  • 开本: 16开
  • 页数: 260
  • 出版年份: 2025
  • 印次: 1
定价:¥48.6 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书主要介绍数据科学 中数据准备阶段常用的数据 处理方法。全书内容分为五 个部分:数据准备概览、数 据清理、数据变换、数据归 约和案例分析。本书注重方 法的原理及其应用,在方法 原理引介部分强调重要的统 计学思想,在方法应用部分 强化数据思维和数据处理规 范。 本书可作为高等学校统 计学类专业、数据科学专业 ,以及人工智能、计算机科 学技术等专业的本科生或研 究生的教材或教学参考书, 同时可供相关领域工作者参 考使用。
目录
第一部分 概览 第一章 数据准备概述 1.1 数据准备的必要性 1.2 数据准备的步骤 1.3 数据准备的评价与优化 1.4 案例分析 本章小结 习题 参考文献 第二章 数据理解 2.1 数据特点 2.2 计量尺度 2.3 数据质量 本章小结 习题 参考文献 第二部分 数据清理 第三章 清洗脏数据 本章小结 习题 参考文献 第四章 离群值处理 4.1 离群值处理概述 4.2 一元变量的离群值识别 4.2.1 Z分数与修正的Z分数 4.2.2 箱线图 4.3 椭圆包络 4.3.1 参数的稳健估计:MCD方法 4.3.2 Fast-MCD算法 4.3.3 判别临界值γ的确定 4.4 局部离群点因子 4.4.1 距离、邻居与密度 4.4.2 LOF值 4.4.3 邻居数量k的设置 4.5 孤立森林 4.5.1 孤立树 4.5.2 路径长度 4.5.3 异常分 4.5.4 判别临界值γ的确定 4.6 单类支持向量机 4.6.1 基于线性超平面的离群值识别 4.6.2 参数w的求解 4.6.3 支持向量与离群值 4.6.4 参数ρ的求解 4.6.5 基于非线性超平面的离群值识别 4.7 案例分析 本章小结 习题 参考文献 第五章 缺失值处理

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网