您好,欢迎来到聚文网。 登录 免费注册
Python网络爬虫 Scrapy框架

Python网络爬虫 Scrapy框架

  • 字数: 291000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 出版日期: 2020-01-01
  • 商品条码: 9787115527295
  • 版次: 1
  • 开本: 16开
  • 页数: 216
  • 出版年份: 2020
定价:¥45 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
互联网上存在着大量值得收集的公共信息,而爬虫技术就是获取这些公共信息的主要工具。本书以主流的Scrapy爬虫框架为例,介绍了Python网络爬虫的组成、爬虫框架的使用以及分布式爬虫等内容。本书运用了大量案例和实践。融入了含金量十足的开发经验,使得内容紧密结合实际应用。在此基础上,本书还通过丰富的练习和操作实践,帮助读者巩固所学的内容。本书配以多元的学习资源和支持服务,包括视频、案例素材、学习社区等,为读者提供全方位的学习体验。本书适合作为计算机、大数据等相关专业的教材,也适合具有一定Linux或Python开发基础的人员阅读,还可以作为爬虫工程师的学习用书。
目录
第1章使用第三方库实现信息抓取
任务1使用第三方库实现北京公交站点页面信息抓取
1.1.1介绍爬虫
1.1.2HTTP
1.1.3HTML
1.1.4使用第三方库实现爬虫功能
1.1.5技能实训
任务2使用第三方库实现北京公交站点详细信息抓取
1.2.1lxml库
1.2.2第三方库数据抓取及保存
1.2.3技能实训
本章小结
本章作业
第2章初探Scrapy爬虫框架
任务1安装Scrapy爬虫框架并创建爬虫工程
2.1.1根据使用场景划分爬虫种类
2.1.2开发基于Scrapy爬虫框架的工程
任务2学习并掌握Scrapy爬虫框架各模块的功能
2.2.1Scrapy爬虫工程组成
2.2.2Scrapy爬虫框架架构
本章小结
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网