您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python网络爬虫框架Scrapy从入门到精通
字数: 414000
装帧: 平装
出版社: 北京大学出版社
作者: 张颖
出版日期: 2021-04-01
商品条码: 9787301320228
版次: 1
开本: 16开
页数: 292
出版年份: 2021
定价:
¥79
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
(1)系统:全流程讲解Scrapy的原理和实战,依次击破编程难点。 (2)经典:凝聚笔者十多年的Scrapy使用经验,无私奉献设计秘籍。 (3)深入:浅入深出地介绍爬虫原理、数据爬取、数据保存、数据分析和测试等技术。并且,所有案例都配有对应的代码,拿来就用。
内容简介
本书从Python主流框架Scrapy的简介及网络爬虫知识讲起,逐步深入到Scrapy进阶实战。本书从实战出发,根据不同需求,有针对性地讲解了静态网页、动态网页、App应用是如何爬取所需数据,以及Scrapy是如何部署分布式爬取,最后还介绍了用Scrapy+Pandas是如何进行数据分析及数据展示,让读者不但可以系统地学习Scrapy编程的相关知识,而且还能对Scrapy应用开发有更为深入的理解。
本书分为12章,涵盖的主要内容有Scrapy框架简介;Scrapy网络爬虫知识介绍;Scrapy开发环境的搭建;Scrapy架构及编程;Scrapy进阶;实战项目:Scrapy静态网页的爬取;实战项目:Scrapy动态网页的爬取;实战项目:Scrapy爬取App应用数据;Scrapy的分布式部署与爬取;分布式的实战项目;用Selenium框架测试网站;用Scrapy+Pandas进行数据分析。
本书内容通俗易懂,实例典型,实用性强,特别适合学习Python主流框架Scrapy的入门读者和进阶读者阅读,也适合数据分析与挖掘技术的初学者阅读,还适合相关培训机构的师生阅读。
作者简介
张颖,“清颖设计”微信公众号创始人,现任上海懂得网络科技有限公司技术部主管,从事编程开发十余年,熟悉Python的方方面面,尤其擅长Python爬虫和数据分析。
目录
第1章Scrapy框架简介
1.1Scrapy简介2
1.2关于本书:目标和用途2
1.3进行自动化数据爬取的重要性3
1.4掌握自动化测试的重要性3
1.5合理规划,开发高质量的应用4
1.6网络数据的采集法律与道德约束5
1.7本章小结5
第2章Scrapy网络爬虫知识介绍
2.1爬虫的作用7
2.2爬虫推荐的前端知识9
2.3爬虫经常用的Python语法26
2.4本章小结44
第3章Scrapy开发环境的搭建
3.1安装Python47
3.2数据库的安装50
3.3安装Scrapy56
3.4本章小结60
第4章Scrapy架构及编程
4.1Scrapy架构及目录源码分析62
4.2Scrapy项目的创建和管理67
4.3PyCharm如何调试Scrapy72
4.4Scrapy的组件77
4.5Scrapy的数据流78
4.6数据存储78
4.7Scrapy如何定义中间件80
4.8Scrapy其他方法的使用82
4.9本章小结83
第5章Scrapy进阶
5.1理解Scrapy性能85
5.2编写Spider的逻辑93
5.3Item和Pipeline95
5.4数据库存储98
5.5Scrapy集成随机User-Agent和代理IP100
5.6突破反爬技术102
5.7图片和文件下载103
5.8如何部署爬虫108
5.9计划定时爬取111
5.10本章小结112
第6章实战项目:Scrapy静态网页的爬取
6.1采集需求及网页分析114
6.2数据表的设计115
6.3获取和解析列表、详情页115
6.4数据存储117
6.5数据的导出和展示119
6.6本章小结121
第7章实战项目:Scrapy动态网页的爬取
7.1采集需求及网页分析123
7.2Selenium的安装和使用124
7.3解析网页及代码的实现126
7.4数据的存储128
7.5数据的导出130
7.6本章小结133
第8章实战项目:Scrapy爬取App应用数据
8.1搭建开发环境135
8.2移动自动化工具:UiAutomatorViewer144
8.3AppiumDesktop工具的录制功能147
8.4App应用数据抓取实战项目150
8.5本章小结158
第9章Scrapy的分布式部署与爬取
9.1分布式系统概述及要点160
9.2使用Gerapy管理分布式爬虫162
9.3通过Scrapyd+ScrapydWeb简单高效地部署和监控分布式爬虫项目168
9.4使用Scrapy-Redis实现分布式爬虫174
9.5本章小结195
第10章分布式的实战项目
10.1搭建Redis服务器197
10.2创建主项目及配置Scrapy-Redis197
10.3创建从项目及配置Scrapy-Redis200
10.4部署代理IP池及User-Agent203
10.5执行程序205
10.6本章小结206
第11章用Selenium框架测试网站
11.1网站测试简介208
11.2用Scrapy+Selenium进行前端自动化测试208
11.3本章小结235
第12章用Scrapy+Pandas进行数据分析
12.1Python数据分析概述237
12.2NumPy简介及操作238
12.3Matplotlib简介及操作247
12.4Pandas简介及操作256
12.5实战项目:Scrapy爬取网站并用Pandas进行数据分析267
12.6本章小结284
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网