您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
大数据分析 Python爬虫、数据清洗和数据可视化 第2版·微课视频版
字数: 508000
装帧: 平装
出版社: 清华大学出版社
出版日期: 2022-09-01
商品条码: 9787302605232
版次: 2
开本: 16开
页数: 352
出版年份: 2022
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、习题答案,作者还为本书精心录制了600分钟的微课视频。
内容简介
本书的编写目的是向读者介绍大数据分析的基本概念和相应的技术应用。全书共10章,分别介绍大数据概述、爬虫和大数据相关技术、Scrapy爬虫、Python与MySQL数据库连接与查询、数据可视化基础与应用、大数据存储与清洗、数据格式与编码技术、数据抽取与采集、pandas数据分析与清洗以及综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析相关技术,并对书中重要的、核心的知识点加大练习的比例,以达到熟练应用的目的。本书可作为高等院校大数据专业、人工智能专业、软件技术专业、云计算专业、计算机网络专业的专业课教材,也可作为大数据爱好者的参考书。
目录
第1章 大数据
1.1 大数据概述
1.1.1 大数据介绍
1.1.2 大数据的特征
1.1.3 大数据技术基础
1.1.4 大数据应用
1.2 大数据的意义
1.2.1 大数据的国家战略意义
1.2.2 大数据的企业意义
1.2.3 我国大数据市场的预测
1.3 大数据的产业链分析
1.3.1 技术分析
1.3.2 运营分析
1.4 本章小结
1.5 实训
习题
第2章 爬虫与大数据
2.1 爬虫概述
2.1.1 爬虫介绍
2.1.2 爬虫的地位与作用
2.2 Python介绍
2.2.1 Python开发环境的搭建
2.2.2 编写Python程序
2.2.3 Python数据类型
2.3 爬虫相关知识
2.3.1 了解网页结构
2.3.2 Python与爬虫
2.3.3 基础爬虫框架
2.3.4 正则表达式
2.4 利用爬虫抓取网页内容
2.4.1 观察与分析页面
2.4.2 抓取过程分析
2.4.3 获取页面内容
2.5 本章小结
2.6 实训
习题
第3章 Scrapy爬虫
3.1 Scrapy爬虫概述
3.2 Scrapy原理
3.2.1 Scrapy框架的架构
3.2.2 Request对象和Response对象
3.2.3 Select对象
3.2.4 Spider开发流程
3.3 Scrapy的开发与实现
3.3.1 Scrapy爬虫的开发流程
3.3.2 创建Scrapy项目并查看结构
3.3.3 编写代码并运行爬虫
3.4 本章小结
3.5 实训
习题
第4章 数据库连接与查询
4.1 数据库
4.1.1 数据库概述
4.1.2 关系数据库设计
4.2 MySQL数据库
4.2.1 MySQL数据库概述
4.2.2 MySQL数据库的下载、安装与运行
4.2.3 MySQL数据库命令行入门
4.3 使用Python操作MySQL数据库
4.3.1 pymysql的安装与使用
4.3.2 使用Python连接MySQL数据库
4.4 本章小结
4.5 实训
习题
第5章 数据可视化基础与应用
5.1 数据可视化
5.1.1 数据可视化概述
5.1.2 数据可视化工具
5.1.3 数据可视化图表
5.2 matplotlib可视化基础
5.2.1 numpy库
5.2.2 matplotlib的认识与安装
5.2.3 matplotlib测试
5.2.4 matplotlib.pyplot库
5.3 matplotlib可视化绘图
5.3.1 绘制线性图形
5.3.2 绘制柱状图
5.3.3 绘制直方图
5.3.4 绘制散点图
5.3.5 绘制极坐标图
5.3.6 绘制饼图
5.4 pyecharts可视化应用
5.5 本章小结
5.6 实训
习题
第6章 大数据存储与清洗
6.1 大数据存储
6.2 数据清洗
6.2.1 数据清洗概述
6.2.2 数据清洗的原理
6.2.3 数据清洗的流程
6.2.4 数据清洗的工具
6.3 数据标准化
6.3.1 数据标准化的概念
6.3.2 数据标准化的方法
6.3.3 数据标准化的实例
6.4 本章小结
6.5 实训
习题
第7章 数据格式与编码技术
7.1 文件格式
7.2 数据类型与编码
7.2.1 数据类型概述
7.2.2 字符编码
7.2.3 数据转换
7.3 Kettle数据清洗与转换工具的使用
7.3.1 Kettle概述
7.3.2 Kettle的安装与使用
7.4 CSV格式的数据转换
7.4.1 CSV格式概述
7.4.2 CSV与JSON文件的转换
7.5 本章小结
7.6 实训
习题
第8章 数据抽取与采集
8.1 数据抽取
8.2 文本抽取与实现
8.2.1 文本文件的抽取
8.2.2 CSV文件的抽取
8.2.3 JSON文件的抽取
8.3 网页数据抽取与实现
8.3.1 网页数据抽取
8.3.2 Excel抽取网页数据
8.3.3 Kettle抽取网页数据
8.4 数据采集与实现
8.5 本章小结
8.6 实训
习题
第9章 pandas数据分析与清洗
9.1 认识pandas
9.2 pandas的语法与使用
9.3 pandas读取与清洗数据
9.3.1 数据准备
9.3.2 从CSV中读取数据
9.3.3 pandas数据清洗
9.4 pandas数据可视化
9.4.1 pandas绘图概述
9.4.2 pandas绘图方法
9.5 本章小结
9.6 实训
习题
第10章 综合实训
10.1 数据清洗实训
10.1.1 使用Kettle对生成的随机数实现字段选择
10.1.2 使用Kettle连接不同的数据表
10.1.3 使用Kettle过滤数据表
10.1.4 使用Kettle连接MySQL数据库并输出查询结果
10.2 数据分析实训
10.3 本章小结
习题
参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网