您好,欢迎来到聚文网。 登录 免费注册
数据采集及预处理基础与应用

数据采集及预处理基础与应用

  • 字数: 427000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 作者: 陈瑛,许桂秋,周敏 编
  • 出版日期: 2024-02-01
  • 商品条码: 9787115635259
  • 版次: 1
  • 开本: 16开
  • 页数: 296
  • 出版年份: 2024
定价:¥79.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用,以及数据可视化的基础内容。本书采用任务式编写形式,将大数据预处理技术的理论和实现分解到一个个任务中,融入到一个个典型案例中,让读者在完成各任务的同时掌握和理解相关内容。
本书既有技术的深度,也有行业应用的广度,适合作为高等院校计算机、数据科学与大数据技术等相关专业课程的教材,也适合作为数据处理行业从业人员的参考用书。
目录
第1章Scrapy电影评论数据采集1
任务1.1数据采集1
1.1.1数据采集概述1
1.1.2数据采集方法1
1.1.3数据采集应用3
任务1.2网络爬虫4
1.2.1网络爬虫概述4
1.2.2常用网络爬虫方法4
1.2.3常用网络爬虫工具5
任务1.3网络爬虫实战6
1.3.1获取网页7
1.3.2解析网页9
1.3.3应对反爬机制11
本章习题12
第2章数据预处理环境安装13
任务2.1数据预处理出现的背景及其目的13
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网