您好,欢迎来到聚文网。 登录 免费注册
大数据处理:从采集到可视化

大数据处理:从采集到可视化

  • 字数: 229000
  • 装帧: 平装
  • 出版社: 武汉大学出版社
  • 出版日期: 2020-07-01
  • 商品条码: 9787307215146
  • 版次: 1
  • 开本: 16开
  • 页数: 224
  • 出版年份: 2020
定价:¥38 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书共分为9章,第一章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
目录
第1章数据采集
1.1大数据概念
1.2大数据类型及特征
1.3数据采集方法
1.3.1问卷调查方法
1.3.2网络用户数据收集方法
1.3.3系统曰志采集方法
1.3.4网络数据采集方法
第2章数据清洗
2.1数据质量维度
2.2数据预处理之数据可能存在的问题
2.3数据质量问题的原因分析
2.3.1数据源数据质量问题的原因分析
2.3.2数据分析阶段数据质量问题的原因分析
2.4数据预处理之数据问题处理方法
2.4.1变化量识别
2.4.2错误拒绝
2.4.3列清洗
2.4.4行过滤
2.5记录匹配算法
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网