您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
数据采集与预处理
字数: 438000
装帧: 平装
出版社: 西安电子科技大学出版社
出版日期: 2022-02-01
商品条码: 9787560663562
版次: 1
开本: 16开
页数: 296
出版年份: 2022
定价:
¥42
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
随着国家大数据相关政策、规划的密集出台,大数据、人工智能商业落地速度加快,其在各个领域的应用也越来越广泛,其中面向企业服务、金融、医疗健康、电子政务、电子商务等细分领域的大数据应用展现出巨大的潜力。
大数据是需要新处理模式才能适应的海量、高增长率和多样化的信息资产,被誉为“未来的新石油”,以至于数据的获取、存储、搜索、共享、分析以及可视化呈现都成为当前重要的研究课题。
本书重点讲述数据采集与预处理的相关内容,并以真实案例介绍不同数据源的采集方式及基本的数据预处理方法。全书共10章。其中,第1章为概述,第2~5章介绍静态网页数据爬取,第6章介绍动态网页数据爬取,第7、8章介绍爬虫(Scrapy)框架应用,第9章介绍数据预处理,第10章给出了一个综合项目实训。
本书可作为高校数据科学与大数据技术专业相关课程的教材或教学参考书,也可作为人工智能、大数据领域从业者的自学参考书。
目录
第1章 概述
1.1 大数据采集
1.1.1 大数据来源
1.1.2 大数据采集方式
1.1.3 数据预处理
1.2 网络爬虫原理和分类
1.2.1 爬虫原理
1.2.2 爬虫分类
1.2.3 常用爬虫工具
1.3 网络爬虫法律规范
1.3.1 数据隐私保护
1.3.2 Robots协议
1.3.3 法律法规
本章小结
本章习题
第2章 Python基础
2,1 Python环境搭建
2.1.1 Python解释器
2.1.2 PyCharm的安装
2.2 Python基础
2.2.1 Python语法基础
2.2.2 数据类型
2.2.3 程序结构
2.2.4 函数
2.2.5 面向对象
本章小结
本章习题
第3章 静态网页爬取
3.1 HTTP协议概述
3.1.1 请求响应模型
3.1.2 请求报文
3.1.3 响应报文
3.2 使用Requests库提取网页数据
3.2.1 Requests库的安装
3.2.2 Requests库的请求方法
3.2.3 使用Requests库发送GET请求
3.2.4 使用Requests库发送POST请求
3.2.5 Requests库的响应对象
3.2.6 HTTP状态码
3.2.7 定制请求头
3.2.8 Requests库发送GET请求的通用代码
3.3 使用urllib库提取网页数据
3.3.1 使用urllib库发送GET请求
3.3.2 使用urllib库发送POST请求
3.3.3 urllib库的用户代理
3.4 案例1 QQ表情包图片爬取
3.4.1 任务描述
3.4.2 任务分析
3.4.3 任务实现
3.5 案例2 手机号码归属地查询
3.5.1 任务描述
3.5.2 任务分析
3.5.3 任务实现
本章小结
本章习题
第4章 网页解析
4.1 使用BeautifulSoup解析网页
4.1.1 BeautifulSoup库的安装
4.1.2 BeautifulSoup解析器
……
第5章 数据存储
第6章 动态网页爬取
第7章 Scrpay框架初探
第8章 Scrpay框架深入
第9章 数据预处理
第10章 招聘网站数据分析
参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网