您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python数据分析与实战
字数: 392
出版社: 人民邮电
作者: 编者:赵男男//邹平辉|
商品条码: 9787115656216
适读年龄: 12+
版次: 1
开本: 16开
页数: 256
出版年份: 2025
印次: 1
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书全面介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共10章,第1章介绍数据分析的概念等相关知识;第2~6章介绍Python数据分析的常用库及其应用,涵盖NumPy数组计算基础,pandas统计分析基础,使用pandas进行数据预处理,Matplotlib、seaborn、pyecharts数据可视化基础,以及使用scikit-learn构建模型,较为全面地阐述Python数据分析方法;第7~9章结合前面章节介绍的数据分析技术,进行企业综合案例数据分析;第10章基于去编程化的TipDM大数据挖掘建模平台进行客户流失预测。除了第1章,其余各章都包含实训,有利于读者通过练习和操作实践巩固所学内容。 本书可以作为高校大数据技术相关专业的教材和大数据技术爱好者的自学参考书。
作者简介
赵男男,广东海洋大学副教授,硕士研究生导师,省优秀教师,九三学社社员,市政协委员,中国人工智能学会专委委员,广东海洋大学计算机科学与工程学院副院长,主要从事计算机应用方向教学与科研工作。在国内外权威刊物累计发表论文50余篇,获发明专利3项,软件著作权10项,主持省部级课题10余项,参与课题若干项。 曾在国内外重要学术刊物上发表学术论文10余篇,主导编写图书专著60余部,其中获普通高等教育“十一五”规划教材一部,“十三五”职业教育国家规划教材一部;参与标准建设4项,主持国家级课题1项、省部级课题4项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有信访、电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景,并荣获中国产学研合作促进奖、中国南方电网公司发明专利一等奖、广东省农业技术推广二等奖、广州市荔湾区科学技术进步奖。
目录
第 1章 Python数据分析概述 1 1.1 认识数据分析 2 1.1.1 数据分析的概念 2 1.1.2 数据分析的流程 3 1.1.3 数据分析的应用场景 5 1.2 Python数据分析 6 1.2.1 数据分析常用工具 7 1.2.2 Python数据分析的优势 7 1.2.3 Python数据分析常用库 8 1.3 安装Python的Anaconda发行版 10 1.3.1 Python的Anaconda发行版 10 1.3.2 在Windows系统中安装Anaconda发行版 10 1.4 Jupyter Notebook的常用功能 13 1.4.1 Jupyter Notebook的基本功能 13 1.4.2 Jupyter Notebook的高级功能 15 小结 18 课后习题 18 第 2章 NumPy数组计算基础 20 2.1 NumPy数组对象ndarray 21 2.1.1 创建数组对象 21 2.1.2 生成随机数 27 2.1.3 通过索引访问数组 29 2.1.4 变换数组的形状 31 2.2 NumPy矩阵与通用函数 34 2.2.1 创建NumPy矩阵 34 2.2.2 ufunc函数 37 2.3 利用NumPy进行统计分析 40 2.3.1 读/写文件 40 2.3.2 使用函数进行简单的统计分析 43 小结 47 实训 48 实训1 使用数组比较运算对超市牛奶价格进行对比 48 实训2 创建6×6的简单数独游戏矩阵 48 课后习题 48 第3章 pandas统计分析基础 50 3.1 读/写不同数据源的数据 51 3.1.1 认识pandas 51 3.1.2 读/写文本文件 52 3.1.3 读/写Excel文件 55 3.1.4 读/写数据库 57 3.2 DataFrame的常用操作 60 3.2.1 查看DataFrame的常用属性 60 3.2.2 查、改、增、删DataFrame数据 61 3.2.3 描述分析DataFrame数据 67 3.3 转换与处理时间序列数据 70 3.3.1 转换时间字符串为标准时间 70 3.3.2 提取时间序列数据 72 3.3.3 时间数据的算术运算 73 3.4 使用分组聚合进行组内计算 74 3.4.1 使用groupby()方法拆分数据 75 3.4.2 使用agg()方法聚合数据 76 3.4.3 使用apply()方法聚合数据 79 3.4.4 使用transform()方法聚合数据 80 小结 81 实训 81 实训1 读取并查看某地区房屋销售数据的基本信息 81 实训2 提取房屋售出时间信息并描述房屋价格信息 81 实训3 使用分组聚合方法分析房屋销售情况 82 课后习题 82 第4章 使用pandas进行数据预处理 85 4.1 数据合并 86 4.1.1 堆叠合并 86 4.1.2 主键合并 89 4.1.3 重叠合并 90 4.2 数据清洗 92 4.2.1 检测与处理重复值 92 4.2.2 检测与处理缺失值 95 4.2.3 检测与处理异常值 99 4.3 数据标准化 100 4.3.1 离差标准化 101 4.3.2 标准差标准化 101 4.3.3 小数定标标准化 102 4.4 数据变换 103 4.4.1 哑变量处理 103 4.4.2 离散化处理 104 小结 107 实训 107 实训1 合并年龄、平均血糖数据和中风患者信息数据 107 实训2 删除年龄异常的数据 108 实训3 离散化年龄特征 109 课后习题 109 第5章 Matplotlib、seaborn、pyecharts数据可视化基础 111 5.1 Matplotlib基础绘图 112 5.1.1 pyplot绘图基础语法与常用参数 112 5.1.2 使用Matplotlib绘制进阶图形 118 5.2 seaborn基础绘图 128 5.2.1 seaborn绘图基础 128 5.2.2 使用seaborn绘制基础图形 144 5.3 pyecharts基础绘图 145 5.3.1 pyecharts绘图基础 146 5.3.2 使用pyecharts绘制交互式图形 150 小结 155 实训 155 实训1 分析学生成绩特征的分布与分散情况 155 实训2 分析学生成绩与各个特征之间的关系 156 实训3 分析各空气质量指标之间的相关关系 156 实训4 绘制交互式基础图形 157 课后习题 158 第6章 使用scikit-learn构建模型 160 6.1 使用sklearn转换器处理数据 161 6.1.1 加载datasets模块中的数据集 161 6.1.2 将数据集划分为训练集和测试集 164 6.1.3 使用sklearn转换器进行数据预处理 165 6.2 构建并评价聚类模型 167 6.2.1 使用sklearn估计器构建聚类模型 168 6.2.2 评价聚类模型 171 6.3 构建并评价分类模型 173 6.3.1 使用sklearn估计器构建分类模型 173 6.3.2 评价分类模型 175 6.4 构建并评价回归模型 176 6.4.1 使用sklearn估计器构建线性回归模型 177 6.4.2 评价回归模型 179 小结 180 实训 181 实训1 使用sklearn处理竞标行为数据集 181 实训2 构建基于竞标行为数据集的K-Means聚类模型 182 实训3 构建基于竞标行为数据集的支持向量机分类模型 182 实训4 构建基于竞标行为数据集的回归模型 182 课后习题 183 第7章 竞赛网站用户行为分析 185 7.1 竞赛网站用户行为分析的背景和方法 186 7.1.1 分析竞赛网站背景 186 7.1.2 认识用户行为分析 187 7.1.3 竞赛网站用户行为分析的步骤与流程 187 7.2 预处理竞赛网站用户访问数据 188 7.2.1 用户识别 188 7.2.2 数据清洗 189 7.2.3 网页分类 192 7.2.4 构造特征 194 7.3 对竞赛网站用户进行分群 194 7.3.1 K-Means聚类算法 195 7.3.2 使用K-Means聚类算法进行用户分群 196 7.3.3 模型应用 198 小结 198 实训 198 实训1 处理某App用户信息数据集 198 实训2 构建与用户使用信息相关的特征 199 实训3 构建K-Means聚类模型 200 课后习题 200 第8章 企业所得税预测分析 201 8.1 企业所得税预测的背景与方法 202 8.1.1 分析企业所得税预测背景 202 8.1.2 企业所得税预测的方法 204 8.1.3 企业所得税预测的步骤与流程 204 8.2 分析企业所得税数据特征的相关性 205 8.2.1 相关性分析 205 8.2.2 计算Pearson相关系数 205 8.3 使用Lasso回归方法选取企业所得税预测的关键特征 207 8.3.1 Lasso回归方法 207 8.3.2 选取关键特征 208 8.4 使用灰色预测算法和SVR算法构建企业所得税预测模型 209 8.4.1 灰色预测算法 209 8.4.2 SVR算法 210 8.4.3 预测企业所得税 211 小结 214 实训 215 实训1 处理二手汽车交易数据集 215 实训2 构建二手汽车价格预测关键特征 216 实训3 构建线性回归模型 216 课后习题 217 第9章 餐饮企业客户流失预测 218 9.1 餐饮企业客户分析需求 219 9.1.1 分析餐饮企业客户流失预测背景 219 9.1.2 认识餐饮企业客户流失预测 221 9.1.3 餐饮企业客户流失预测的步骤与流程 221 9.2 预处理餐饮企业数据 221 9.2.1 数据探索 222 9.2.2 查看重复值 224 9.2.3 处理异常值 224 9.2.4 处理缺失值 225 9.2.5 构建客户流失特征 226 9.3 使用决策树算法和支持向量机算法进行餐饮企业客户流失预测 228 9.3.1 决策树算法 228 9.3.2 支持向量机算法 229 9.3.3 预测餐饮企业客户流失 231 小结 233 实训 233 实训1 预处理尺码信息数据 233 实训2 构建支持向量机分类模型预测客户服装尺寸 234 课后习题 234 第 10章 基于TipDM大数据挖掘建模平台进行客户流失预测 236 10.1 平台简介 237 10.1.1 共享库 238 10.1.2 数据连接 238 10.1.3 数据集 239 10.1.4 我的工程 239 10.1.5 个人组件 242 10.2 使用平台进行客户流失预测 242 10.2.1 使用平台配置客户流失预测案例的步骤和流程 242 10.2.2 数据源配置 244 10.2.3 数据预处理 245 10.2.4 构建模型 251 小结 256 实训 256 实训 预测客户服装尺寸 256 课后习题 256
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网