您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
精通Python爬虫框架Scrapy
字数: 225000
装帧: 平装
出版社: 人民邮电出版社
作者: (美)迪米特里奥斯·考奇斯-劳卡斯
出版日期: 2018-02-01
商品条码: 9787115474209
版次: 1
开本: 16开
页数: 256
出版年份: 2018
定价:
¥69.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
1.内容丰富,涵盖Scrapy基础知识+实际应用,深入讲解爬虫专业人员的秘密 2.作者具有15年以上的软件开发经验,能将知识点清晰、有条理地呈现给读者,有效传授爬虫技能 3.在学习完本书后,你将对数据爬取胸有成竹,并将数据应用在自己的应用程序中
内容简介
Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架,用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。
本书共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。
本书适合软件开发人员、数据科学家,以及对自然语言处理和机器学习感兴趣的人阅读。
作者简介
Dimitrios Kouzis-Loukas作为一位软件开发人员,已经拥有超过15年的经验。同时,他还使用自己掌握的知识和技能,向广大读者讲授如何编写软件。 他学习并掌握了多门学科,包括数学、物理学以及微电子学。他对这些学科的透彻理解,提高了自身的标准,而不只是“实用的解决方案”。他知道真正的解决方案应当是像物理学规律一样确定,像ECC内存一样健壮,像数学一样通用。 Dimitrios目前正在使用新的数据中心技术开发低延迟、高可用的分布式系统。他是语言无关论者,不过对Python、C++和Java略有偏好。他对开源软硬件有着坚定的信念,他希望他的贡献能够造福于各个社区和全人类。
目录
第1章Scrapy简介1
1.1初识Scrapy1
1.2喜欢Scrapy的更多理由2
1.3关于本书:目标和用途3
1.4掌握自动化数据爬取的重要性4
1.4.1开发健壮且高质量的应用,并提供合理规划4
1.4.2快速开发高质量可行产品5
1.4.3Google不会使用表单,爬取才能扩大规模6
1.4.4发现并融入你的生态系统7
1.5在充满爬虫的世界里做一个好公民7
1.6Scrapy不是什么8
1.7本章小结9
第2章理解HTML和XPath10
2.1HTML、DOM树表示以及XPath10
2.1.1URL11
2.1.2HTML文档11
2.1.3树表示法13
2.1.4你会在屏幕上看到什么14
2.2使用XPath选择HTML元素15
2.2.1有用的XPath表达式16
2.2.2使用Chrome获取XPath表达式19
2.2.3常见任务示例20
2.2.4预见变化21
2.3本章小结22
第3章爬虫基础23
3.1安装Scrapy24
3.1.1MacOS24
3.1.2Windows25
3.1.3Linux25
3.1.4新源码安装26
3.1.5升级Scrapy26
3.1.6Vagrant:本书中运行示例的官方方式27
3.2UR2IM——基本抓取流程28
3.2.1URL29
3.2.2请求和响应31
3.2.3Item31
3.3一个Scrapy项目37
3.3.1声明item38
3.3.2编写爬虫40
3.3.3填充item43
3.3.4保存文件45
3.3.5清理——item装载器与管理字段47
3.3.6创建contract50
3.4抽取更多的URL53
3.4.1使用爬虫实现双向爬取56
3.4.2使用CrawlSpider实现双向爬取59
3.5本章小结61
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网