您好,欢迎来到聚文网。 登录 免费注册
数据准备和特征工程——数据工程师必知必会技能

数据准备和特征工程——数据工程师必知必会技能

  • 字数: 332000
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 作者: 齐伟
  • 出版日期: 2020-03-01
  • 商品条码: 9787121382635
  • 版次: 1
  • 开本: 16开
  • 页数: 198
  • 出版年份: 2020
定价:¥45 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。
作者简介
齐伟,自称老齐,现居苏州,所著在线教程《零基础学Python》及《零基础学Python(第2版)》在业内引起非常大的反响。愿意和来自各方的朋友讨论技术问题,并能提供相关技术服务。
目录
第1章 感知数据001
1.0了解数据科学项目001
1.1文件中的数据003
1.1.1CSV文件003
1.1.2Excel文件009
1.1.3图像文件015
1.2数据库中的数据019
1.3网页上的数据029
1.4来自API的数据039
第2章 数据清理044
2.0基本概念045
2.1转化数据类型046
2.2处理重复数据054
2.3处理缺失数据057
2.3.1检查缺失数据058
2.3.2用指定值填补063
2.3.3根据规律填补069
2.4处理离群数据076
第3章 特征变换083
3.0特征的类型084
3.1特征数值化085
3.2特征二值化088
3.3OneHot编码093
3.4数据变换098
3.5特征离散化104
3.5.1无监督离散化104
3.5.2有监督离散化110
3.6数据规范化113
第4章 特征选择124
4.0特征选择简述124
4.1封装器法127
4.1.1循序特征选择127
4.1.2穷举特征选择135
4.1.3递归特征消除140
4.2过滤器法144
4.3嵌入法149
第5章 特征抽取154
5.1无监督特征抽取154
5.1.1主成分分析154
5.1.2因子分析161
5.2有监督特征抽取167
附录A Jupyter简介173
附录B NumPy简介176
附录C Pandas简介185
附录D Matplotlib简介194
后记199

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网