您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
爬虫实战:从数据到产品
装帧: 简装
出版社: 电子工业出版社
作者: 贺思聪
出版日期: 2019-03-01
商品条码: 9787121355080
版次: 1
开本: 其他
页数: 244
出版年份: 2019
定价:
¥69
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
以介绍思路为主,通过丰富的案例讲解爬取数据的思路,介绍数据分析、可视化的方法,以及如何根据数据分析结果,开发一个应用,为读者提供一个从采集数据到应用数据的完整视角。
内容简介
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。最后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品。
作者简介
贺思聪,毕业于电子科技大学,在ThoughtWorks任高级咨询师,担任海外交付团队技术负责人、架构师。
具有十余年产品研发经验,涉及澳洲矿业相关数字产品研发、保险业网站技术架构、光网络设备软件研发、医疗AR/VR、机械控制、加工仿真模拟等领域。
精通大规模重构实践、测试驱动开发,熟悉微服务架构及架构实践,熟悉敏捷项目开发管理流程和相关实践,具有丰富的敏捷团队管理经验。
目录
第1章 基础知识 1 1.1 什么是爬虫 1 1.2 数据获取渠道 2 1.3 抓包分析工具 4 1.4 爬虫和反爬虫的斗争 5 1.5 数据处理、分析和可视化 20 1.6 延深阅读 21 第2章 基于位置信息的爬虫Ⅰ 23 2.1 背景及目标 23 2.2 爬虫原理 24 2.3 数据来源分析 26 2.4 简单的矩形区域爬取方式 38 2.5 高级区域爬取方式 46 2.6 坐标转换 49 2.7 存储数据的方式 49 2.8 数据导入 51 2.9 基本数据分析 52 2.10 地图可视化 56 2.11 轨迹可视化 58 2.12 总结 60 第3章 基于位置信息的爬虫Ⅱ 62 3.1 背景及目标 62 3.2 爬虫原理 62 3.3 优化方案一 71 3.4 优化方案二 75 3.5 优化方案三 82 3.6 导入数据到数据库 97 3.7 基本数据分析及可视化 100 3.8 总结 117 第4章 网站信息爬取及可视化 118 4.1 背景及目标 118 4.2 网站API分析 118 4.3 数据爬取 122 4.4 数据导入 129 4.5 数据分析及可视化 133 4.6 总结 173 第5章 基于逆向分析小程序的爬虫 174 5.1 背景及目标 174 5.2 数据来源分析 176 5.3 数据爬取方案 177 5.4 转换数据格式 195 5.5 总结 196 第6章 从数据到产品 197 6.1 从一张机票说起 197 6.2 从价值探索到交付落地 201 6.3 数据爬取 203 6.4 爬虫架构设计 203 6.5 发现数据的价值 211 6.6 创新的不确定性 223 6.7 产品设计 226 6.8 产品交付 235 6.9 总结 236
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网