您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python网络爬虫技术与应用
字数: 375000
装帧: 平装
出版社: 清华大学出版社
出版日期: 2022-08-01
商品条码: 9787302607496
版次: 1
开本: 16开
页数: 220
出版年份: 2022
定价:
¥69.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
"读者对象 《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材,也可作为大数据及编程爱好者的参考用书。 本书特色 ★★以Python网络爬虫开发为主线,兼顾理论与实战。 ★★赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频,方便教师授课。 "
内容简介
网络爬虫技术的重点之一是网络爬虫框架,因此本书结合网络爬虫框架的相关案例重点介绍网络爬虫的常见框架,包括PySpider网络爬虫框架的安装和使用,Scrapy网络爬虫框架的安装和使用,以及Scrapy网络爬虫管理与部署。另外,本书对Python网络爬虫开发需要的reguests库、Scrapy解析库、存储库、XPath进行了介绍,并介绍了requests库、正则表达式、XPath等的使用方法,还重点讲解了这些库的实际应用。 本书以Python网络爬虫开发为主线,兼顾理论与实战,全面介绍可操作的Python环境与系统开发相关知识,以及大数据算法、大数据分析、大数据系统互补的作用。另外,本书还赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频,方便教师授课。 本书可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材,也可作为大数据及编程爱好者的参考用书。
目录
第1章 网络爬虫概述
1.1 网络爬虫简介
1.1.1 网络爬虫的概念与类别
1.1.2 网络爬虫的流程
1.1.3 网络爬虫的抓取
1.2 网络爬虫的攻防战
1.3 反网络爬虫技术及解决方案
1.4 本章习题
第2章 Python基本知识介绍
2.1 Python编程
2.1.1 Python的安装与环境配置
2.1.2 PyCharm的安装与使用
2.2 HTML基本原理
2.2.1 HTML简介
2.2.2 HTML的基本原理
2.3 基本库的使用
2.3.1 urllib库
2.3.2 requests库
2.3.3 re库
2.4 实战案例:百度新闻的抓取
2.5 本章习题
第3章 原生态网络爬虫开发
3.1 requests库详解
3.1.1 requests语法
3.1.2 requests库的使用
3.2 正则表达式
3.2.1 正则表达式详解与使用
3.2.2 Python与Excel
3.3 实战案例:环球新闻的抓取
3.4 本章习题
第4章 解析HTML内容
4.1 XPath的介绍与使用
4.1.1 XPath的介绍
4.1.2 XPath的使用
4.2 lxml库的安装与使用
4.2.1 lxml库的安装
4.2.2 lxml库的常见方法使用
4.3 Chrome浏览器分析网站
4.4 BeautifulSoup的安装与使用
4.5 实战案例:BeautifulSoup的使用
4.6 页面请求与JSON
4.6.1 JSON的介绍与应用
4.6.2 GET请求和POST请求
4.7 模拟浏览器
4.7.1 Selenium的介绍与安装
4.7.2 模拟点击
4.7.3 Ajax结果提取
4.8 实战案例:小说网站的抓取
4.9 模拟登录与验证
4.9.1 复杂的页面请求
4.9.2 代理IP
4.9.3 Cookie的使用与证书
4.9.4 使用Selenium进行模拟登录
4.10 验证码
4.10.1 手动打码
4.10.2 自动打码
4.11 实战案例:模拟登录及验证
4.11.1 基本思路与方法
4.11.2 使用Cookie
4.12 本章习题
第5章 Python与数据库
5.1 MySQL数据库的安装与应用
5.1.1 MySQL数据库的安装
5.1.2 MySQL数据库的应用
5.2 MongoDB的安装与使用
5.2.1 MongoDB的安装
5.2.2 MongoDB的使用
5.2.3 MongoDB的可视化工具RockMongo
5.3 Python库pymongo
5.4 本章习题
第6章 Python网络爬虫框架
6.1 Python网络爬虫的常见框架
6.2 PySpider网络爬虫框架简介
6.3 Scrapy网络爬虫框架简介
6.4 PySpider与Scrapy的区别
6.5 PySpider网络爬虫框架的安装和使用
6.5.1 PySpider的安装与部署
6.5.2 PySpider的界面介绍
6.5.3 PySpider的多线程网络爬虫
6.5.4 使用Phantomjs渲染
6.5.5 PySpider网络爬虫时间控制
6.5.6 RabbitMQ队伍去重
6.5.7 在Linux系统下安装部署PySpider
6.5.8 实战案例:使用PySpider抓取题库
6.6 Scrapy网络爬虫框架的安装和使用
6.6.1 Scrapy的简介与安装
6.6.2 Scrapy的项目文件介绍
6.6.3 Scrapy的使用
6.6.4 Scrapy中使用XPath
6.6.5 Scrapy与MongoDB
6.6.6 Scrapy_Redis的安装与使用
6.6.7 使用Redis缓存网页并自动去重
6.6.8 实战案例:抓取豆瓣Top250
6.7 Scrapy网络爬虫管理与部署
6.7.1 Scrapyd管理网络爬虫
6.7.2 使用SpiderKeeper进行任务监控与定时抓取
6.7.3 Supervisor网络爬虫进程管理
6.7.4 Scrapy项目设计思路
6.7.5 实战案例
6.8 本章习题
第7章 综合性实战案例
7.1 实战案例1:瀑布流抓取
7.2 实战案例2:网络爬虫攻防战
7.2.1 网络爬虫攻防技术认识
7.2.2 代理IP地址网站
7.2.3 抓取新浪微博内容
7.2.4 获得微博内容信息并保存到文本中
7.3 实战案例3:分布式抓取
7.3.1 背景/案例知识介绍
7.3.2 某研究中心的数据抓取
7.3.3 查看效果
7.4 实战案例4:微信公众号文章点赞阅读数抓取
7.4.1 所运用的内容讲解
7.4.2 抓取微信公众号文章的评论数据
7.4.3 效果展示
本章习题
参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网