您好,欢迎来到聚文网。 登录 免费注册
Python爬虫实战基础

Python爬虫实战基础

多年企业开发经验的总结,指明Python网络开发从业者的提升方向,配套源代码和视频讲解
  • 字数: 671000
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 作者: 李科均 著
  • 出版日期: 2023-06-01
  • 商品条码: 9787302626565
  • 版次: 1
  • 开本: 16开
  • 页数: 428
  • 出版年份: 2023
定价:¥109 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
本书是Python网络开发从业者的提升方向,理论结合实践,是一本全面的学习指南。
内容简介
本书介绍Python网络爬虫开发从业者应掌握的基础技能。本书以网络爬虫为核心,涉及大大小小数十个能力体系。本书的前半部分介绍爬虫开发的基础知识,包括爬虫开发必备的环境搭建方法、开发中常用工具的使用方法和技巧、网页的构成原理和网页信息提取的方法、常用数据库的使用方法和应用场景,如通过Redis内置的布隆过滤器实现大规模URL地址的去重任务。本书的后半部分主要讲解网络爬虫开发所需的必要能力,包括网络通信的底层原理、背后涉及的互联网协议标准及如何对这些协议进行分析并加以利用,使用Docker部署网络爬虫所需的环境和爬虫项目的打包部署,使用网络爬虫的核心请求库实现与服务器端和客户端的通信和交互,使用自动化神器Selenium对复杂的爬虫需求进行快速实现,以及网络爬虫的多任务开发,重点是通过多线程和多进程来提高爬虫效率。
本书面向准备从事或正在从事网络爬虫开发的从业者以及对网络爬虫有浓厚兴趣的爱好者。
目录
第1章基础开发环境
1.1Docker环境的搭建
1.1.1安装Docker
1.1.2用Docker安装MySQL
1.1.3用Docker安装Redis
1.1.4用Docker安装MongoDB
1.1.5用Docker安装SeleniumGrid
1.2Python的开发环境
1.2.1Python的优点、缺点
1.2.2Python解释器
1.2.3PythonIDE
1.3JavaScript的运行环境
1.4辅助工具的安装
1.4.1安装Git
1.4.2安装ADB驱动
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网