您好,欢迎来到聚文网。 登录 免费注册
爬虫逆向进阶实战

爬虫逆向进阶实战

  • 字数: 664000
  • 装帧: 平装
  • 出版社: 机械工业出版社
  • 作者: 李玺
  • 出版日期: 2022-05-01
  • 商品条码: 9787111704522
  • 版次: 1
  • 开本: 16开
  • 页数: 372
  • 出版年份: 2022
定价:¥139 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书以爬虫逆向方向的相关技术和岗位要求进行撰写,总结了爬虫的架构体系、主流框架和未来发展。书中包括各种自动化工具、抓包工具、逆向工具的使用。核心内容以Web Js逆向、安卓逆向、小程序逆向为主,结合三十多个实战案例进行分析,内容从易到难,循序渐进。另外还对主流的反爬虫技术进行了讲解,包括传输协议、验证码体系、字符集映射、行为和指纹等。扫描封底二维码,可获得反爬虫补充知识;扫描节中二维码,可获得配套视频讲解知识。本书适合对爬虫逆向感兴趣,想进一步提升自我的程序员参考阅读。
作者简介
李玺,作者久居一线开发,目前就职中科大数据研究院。深耕爬虫和逆向方向,拥有丰富的经验和精湛的技巧,独立开发过Asyncpy爬虫框架、crawlx爬虫管理平台。作者是CSDN博客专家,爬虫逆向社区站长,荣获CSDN首届GEEK+原创大赛一等奖、2019、2020、2021年博客之星。拥有多项爬虫领域发明专利,新工科大数据技术能力认证,国家科技志愿者,河南省中原科技城E类人才。
目录
前言第1章网络爬虫架构
1.1爬虫发展史
1.2爬虫基本架构
1.3分布式爬虫架构
1.3.1主从分布式
1.3.2对等分布式
1.4网络爬虫遍历策略
1.4.1广度优先策略
1.4.2深度优先策略
1.4.3很好优先策略
1.5智能采集系统架构
1.5.1采集需求分类
1.5.2页面智能解析
1.5.3数据管理模块
第2章Python爬虫技巧
2.1Utils
2.1.1爬虫工具包
2.1.2智能解析库
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网