您好,欢迎来到聚文网。 登录 免费注册
大数据爬虫技术(21世纪技能创新型人才培养系列教材)/大数据系列

大数据爬虫技术(21世纪技能创新型人才培养系列教材)/大数据系列

  • 字数: 288
  • 出版社: 中国人民大学
  • 作者: 编者:黄源//李兵川//尹光辉|责编:苏昌盛//郭会娟
  • 商品条码: 9787300318851
  • 版次: 1
  • 页数: 212
  • 出版年份: 2023
  • 印次: 1
定价:¥49 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书从网络爬虫技术出发,结合一线教师的教学实际经验与当前学生的实际情况编写而成,侧重于讲述爬虫技术知识,注重专业应用能力和计算思维能力的培养。本书深入浅出地讲解了大数据爬虫技术。全书共6 个项目,包括爬虫基础、Python 爬虫、爬虫与数据存储、Scrapy 框架、爬取动态网页以及爬虫与数据分析。每节列出了学习目标,指明了教与学的知识、技能、素养培养方向,并附带上机实训项目与操作指导,理论与实践相结合,实用性强,方便学生及时巩固技能,提升操作能力。
作者简介
黄源,重庆航天职业技术学院大数据技术与应用专业负责人,教授, 主要讲授“大数据导论”“大数据分析”“数据可视化”等专业核心课程;主编的教材有《数据清洗》《大数据分析》《Linux操作系统应用》《计算机网络基础》等,具有丰富的专业课程教学经验和教材编写经验。曾主持重庆市教委重大课题。
目录
项目1 爬虫基础
教学目标
1.1 爬虫简介
1.2 爬虫基础
1.3 网页的请求和响应
1.4 Python 的安装与使用
1.5 项目小结
1.6 实训
1.7 习题
项目2 Python 爬虫
教学目标
2.1 urllib 库
2.2 requests 库
2.3 正则表达式
2.4 BeautifulSoup
2.5 Xpath
2.6 PyQuery
2.7 JsonPath
2.8 基础爬虫框架
2.9 项目小结
2.10 实训
2.11 习题
项目3 爬虫与数据存储
教学目标
3.1 文件格式
3.2 MySQL 数据库
3.3 Redis 数据库
3.4 OrientDB 数据库
3.5 Python 操作MySQL 数据库
3.6 项目小结
3.7 实训
3.8 习题
项目4 scrapy 框架
教学目标
4.1 Scrapy 框架简介
4.2 Spider
4.3 Scrapy 的开发与实现
4.4 项目小结
4.5 实训
4.6 习题
项目5 爬取动态网页
教学目标
5.1 应用场景
5.2 动态网页特征
5.3 动态网页爬取
5.4 项目小结
5.5 实训
5.6 习题
项目6 爬虫与数据分析
教学目标
6.1 文本分析
6.2 数据清洗
6.3 Python 爬虫排序算法
6.4 项目小结
6.5 实训
6.6 习题

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网