您好,欢迎来到聚文网。 登录 免费注册
Python机器学习 数据建模与分析(第2版)

Python机器学习 数据建模与分析(第2版)

  • 字数: 647000
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 出版日期: 2023-07-01
  • 商品条码: 9787121459351
  • 版次: 2
  • 开本: 16开
  • 页数: 392
  • 出版年份: 2023
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书将引领读者进入Python机器学习领域。机器学习是一套优选、深刻且内容丰富的算法集合,已成为数据科学中数据建模与分析的重要方法。Python是一款简明、高效且功能强大的开源工具,也是数据科学实践中最常用的计算机语言。学好机器学习的理论方法,掌握Python这个实用工具,是成长为数据科学人才所必需的。本书采用理论与实践相结合的方式,理论上突出可读性并兼具知识深度和广度,实践上强调可操作性并兼具应用广泛性,对机器学习的原理部分进行了深入透彻的讲解,对机器学习的算法部分给出了Python代码,并且在各章中设置了Python编程示例。全彩呈现机器学习的数据建模可视化图例(80多幅彩图),扫描书中相应二维码即可查看。提供配套数据集、源代码、教学PPT等学习资源,登录华信教育资源网(www.hxedu.com.cn)即可免费下载。本书可作为高等院校机器学习、数据分析等专业课程的教材,也可作为数据科学应用研究者及对Python机器学习感兴趣的数据建模与分析从业者的参考书。
目录
第1章机器学习概述1
1.1机器学习的发展:人工智能中的机器学习1
1.1.1符号主义人工智能2
1.1.2基于机器学习的人工智能2
1.2机器学习的核心:数据和数据建模4
1.2.1机器学习的对象:数据集4
1.2.2机器学习的任务:数据建模6
1.3机器学习的典型应用11
1.3.1机器学习的典型行业应用11
1.3.2机器学习在客户细分中的应用12
1.3.3机器学习在客户流失分析中的应用13
1.3.4机器学习在营销响应分析中的应用14
1.3.5机器学习在交叉销售中的应用15
1.3.6机器学习在欺诈甄别中的应用16
本章总结16
本章习题16
第2章Python机器学习基础17
2.1Python:机器学习的优选工具17
2.2Python的集成开发环境:Anaconda18
2.2.1Anaconda的简介19
2.2.2AnacondaPrompt的使用19
2.2.3Spyder的使用20
2.2.4JupyterNotebook的使用22
2.3Python第三方包的引用23
2.4NumPy使用示例23
2.4.1NumPy数组的创建和访问24
2.4.2NumPy的计算功能26
2.5Pandas使用示例28
2.5.1Pandas的序列和索引28
2.5.2Pandas的数据框29
2.5.3Pandas的数据加工处理30
2.6NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析32
2.6.1空气质量监测数据的预处理32
2.6.2空气质量监测数据的基本分析34
2.7Matplotlib的综合应用:空气质量监测数据的图形化展示37
2.7.1AQI的时间序列变化特点37
2.7.2AQI的分布特征及相关性分析38
本章总结40
本章相关函数列表40
本章习题47
第3章数据预测与预测建模48
3.1从线性回归模型说起49
3.1.1线性回归模型的含义49
3.1.2线性回归模型的几何理解50
3.1.3线性回归模型的评价50
3.1.4Python应用实践:PM2.5浓度预测51
3.2认识线性分类模型56
3.2.1线性分类模型的含义56
3.2.2线性分类模型的几何理解58
3.2.3线性分类模型的评价60
3.2.4Python应用实践:空气质量等级预测62
3.3从线性预测模型到非线性预测模型67
3.4预测模型的参数估计68
3.4.1损失函数与有监督学习68
3.4.2参数搜索策略70
3.5预测模型的选择72
3.5.1泛化误差的估计72
3.5.2Python模拟和启示:理解泛化误差75
3.5.3预测模型过拟合问题78
3.5.4模型选择:偏差和方差79
本章总结82
本章相关函数列表83
本章习题83
第4章数据预测建模:贝叶斯分类器84
4.1贝叶斯概率和贝叶斯法则84
4.1.1贝叶斯概率84
4.1.2贝叶斯法则85
4.2朴素贝叶斯分类器85
4.2.1从顾客行为分析角度看朴素贝叶斯分类器85
4.2.2Python模拟和启示:认识朴素贝叶斯分类器的分类边界88
4.2.3Python应用实践:空气质量等级预测91
4.3朴素贝叶斯分类器在文本分类中的应用93
4.3.1Python文本数据预处理:文本分词和量化计算94
4.3.2Python文本描述性分析:词云图和文本相似性97
4.3.3Python文本分析综合应用:裁判文书的要素提取99
4.4贝叶斯参数估计简介*102
4.4.1从科比投篮分析角度看贝叶斯参数估计的基本思想102
4.4.2共轭先验分布103
4.4.3Python应用实践:科比投篮命中率的研究106
本章总结108
本章相关函数列表108
本章习题109
第5章数据预测建模:近邻分析110
5.1近邻分析:K-近邻法110
5.1.1距离:K-近邻法的近邻度量111
5.1.2参数K:1-近邻法和K-近邻法112
5.2回归预测中的K-近邻法113
5.2.1Python模拟和启示:认识K-近邻回归线113
5.2.2Python模拟和启示:认识K-近邻回归面115
5.3分类预测中的K-近邻法117
5.3.1基于1-近邻法和K-近邻法的分类117
5.3.2Python模拟和启示:参数K和分类边界118
5.4基于观测相似性的加权K-近邻法120
5.4.1加权K-近邻法的权重121
5.4.2Python模拟和启示:认识加权K-近邻分类边界123
5.5K-近邻法的Python应用实践124
5.5.1空气质量等级的预测124
5.5.2国产电视剧大众评分的预测126
5.6K-近邻法的适用性探讨*127
本章总结129
本章相关函数列表130
本章习题130
第6章数据预测建模:决策树131
6.1决策树的基本概念131
6.1.1什么是决策树131
6.1.2决策树的深层含义133
6.2回归预测中的决策树134
6.2.1决策树的回归面134
6.2.2Python模拟和启示:树深度对回归面的影响135
6.3分类预测中的决策树136
6.3.1决策树的分类边界137
6.3.2Python模拟和启示:树深度对分类边界的影响137
6.4决策树的生长和剪枝139
6.4.1决策树的生长140
6.4.2决策树的剪枝141
6.5经典决策树算法:CART142
6.5.1CART的生长142
6.5.2CART的后剪枝145
6.6决策树的Python应用实践148
6.6.1PM2.5浓度的预测148
6.6.2空气质量等级的预测149
6.6.3药物适用性研究151
6.7决策树的高方差性*153
本章总结154
本章相关函数列表154
本章习题155
第7章数据预测建模:集成学习156
7.1集成学习概述156
7.1.1高方差性问题的解决途径157
7.1.2从弱模型到强模型的构建157
7.2基于重抽样自举法的集成学习158
7.2.1重抽样自举法158
7.2.2袋装法的基本思想158
7.2.3随机森林的基本思想160
7.2.4Python应用实践:基于袋装法和随机森林预测PM2.5浓度162
7.3从弱模型到强模型的构建:提升法165
7.3.1提升法的基本思路165
7.3.2Python模拟和启示:弱模型联合成为强模型166
7.3.3分类预测中的提升法:AdaBoost.M1算法168
7.3.4Python模拟和启示:认识AdaBoost.M1算法中高权重的样本观测171
7.3.5回归预测中的提升法173
7.3.6Python应用实践:基于AdaBoost预测PM2.5浓度174
7.3.7提升法的推广算法*176
7.4梯度提升决策树179
7.4.1梯度提升算法179
7.4.2梯度提升回归树183
7.4.3Python模拟和启示:认识梯度提升回归树184
7.4.4梯度提升分类树185
7.4.5Python模拟和启示:认识梯度提升分类树186
7.5XGBoost算法188
7.5.1XGBoost算法的目标函数188
7.5.2目标函数的近似表达189
7.5.3决策树的求解190
7.5.4Python应用实践:基于XGBoost算法预测空气质量等级191
本章总结194
本章相关函数列表194
本章习题195
第8章数据预测建模:人工神经网络197
8.1人工神经网络的基本概念198
8.1.1人工神经网络的基本构成198
8.1.2人工神经网络节点的功能199
8.2感知机网络200
8.2.1感知机网络中的节点200
8.2.2感知机网络节点中的加法器201
8.2.3感知机网络节点中的激活函数202
8.2.4Python模拟和启示:认识激活函数203
8.2.5感知机网络的权重训练206
8.3多层感知机网络211
8.3.1多层感知机网络的结构211
8.3.2多层感知机网络中的隐藏节点213
8.3.3Python模拟和启示:认识隐藏节点215
8.4反向传播算法218
8.4.1反向传播算法的基本思想218
8.4.2局部梯度和连接权重更新218
8.5多层神经网络的其他问题*220
8.6人工神经网络的Python应用实践221
8.6.1手写体邮政编码的识别221
8.6.2PM2.5浓度的回归预测224
本章总结225
本章相关函数列表225
本章习题226
第9章数据预测建模:支持向量机227
9.1支持向量分类概述228
9.1.1支持向量分类的基本思路228
9.1.2支持向量分类的三种情况230
9.2接近线性可分下的支持向量分类231
9.2.1接近线性可分下的超平面231
9.2.2参数求解和分类预测233
9.2.3Python模拟和启示:认识支持向量236
9.3广义线性可分下的支持向量分类238
9.3.1广义线性可分下的超平面238
9.3.2广义线性可分下的误差惩罚和目标函数239
9.3.3Python模拟和启示:认识惩罚参数C240
9.3.4参数求解和分类预测242
9.4线性不可分下的支持向量分类243
9.4.1线性不可分问题的一般解决方式243
9.4.2支持向量分类克服维灾难的途径244
9.4.3Python模拟和启示:认识核函数246
9.5支持向量回归概述*249
9.5.1支持向量回归的基本思路249
9.5.2支持向量回归的目标函数和约束条件251
9.5.3Python模拟和启示:认识参数?253
9.6支持向量机的Python应用实践:老人风险体位预警254
9.6.1示例背景和数据说明255
9.6.2Python实现255
本章总结260
本章相关函数列表260
本章习题260
第10章特征选择:过滤、包裹和嵌入策略261
10.1过滤策略下的特征选择262
10.1.1低方差过滤法263
10.1.2高相关过滤法中的方差分析264
10.1.3高相关过滤法中的卡方检验268
10.1.4Python应用实践:过滤策略下手写体邮政编码数字的特征选择270
10.1.5其他高相关过滤法*272
10.2包裹策略下的特征选择274
10.2.1包裹策略的基本思路274
10.2.2递归式特征剔除算法275
10.2.3基于交叉验证的递归式特征剔除算法276
10.2.4Python应用实践:包裹策略下手写体邮政编码数字的特征选择276
10.3嵌入策略下的特征选择278
10.3.1岭回归和Lasso回归278
10.3.2弹性网回归282
10.3.3Python应用实践:嵌入策略下手写体邮政编码数字的特征选择283
本章总结289
本章相关函数列表289
本章习题289
第11章特征提取:空间变换策略290
11.1主成分分析291
11.1.1主成分分析的基本出发点291
11.1.2主成分分析的基本原理292
11.1.3确定主成分295
11.1.4Python模拟与启示:认识主成分296
11.2矩阵的奇异值分解298
11.2.1奇异值分解的基本思路298
11.2.2奇异值分解的Python应用实践:脸部数据特征提取299
11.3核主成分分析*301
11.3.1核主成分分析的出发点301
11.3.2核主成分分析的基本原理303
11.3.3Python模拟和启示:认识核主成分305
11.4因子分析307
11.4.1因子分析的基本出发点308
11.4.2因子分析的基本原理309
11.4.3Python模拟和启示:认识因子分析的计算过程312
11.4.4因子分析的其他问题316
11.4.5因子分析的Python应用实践:空气质量综合评测318
本章总结320
本章相关函数列表321
本章习题321
第12章揭示数据内在结构:聚类分析322
12.1聚类分析概述322
12.1.1聚类分析的目的322
12.1.2聚类算法概述324
12.1.3聚类解的评价325
12.1.4聚类解的可视化328
12.2基于质心的聚类模型:K-均值聚类329
12.2.1K-均值聚类基本过程329
12.2.2基于K-均值聚类的类别预测331
12.2.3Python模拟和启示:认识K-均值聚类中的聚类数目K331
12.3基于连通性的聚类模型:系统聚类335
12.3.1系统聚类的基本过程335
12.3.2系统聚类中距离的连通性度量335
12.3.3Python模拟和启示:认识系统聚类中的聚类数目K336
12.4基于高斯分布的聚类模型:EM聚类*340
12.4.1出发点:有限混合分布341
12.4.2EM聚类算法342
12.4.3Python模拟和启示:认识EM聚类345
12.5聚类分析的Python应用实践:环境污染的区域特征分析348
本章总结351
本章相关函数列表351
本章习题352
第13章揭示数据内在结构:特色聚类353
13.1基于密度的聚类:DBSCAN353
13.1.1DBSCAN中的相关概念353
13.1.2DBSCAN过程355
13.1.3Python模拟和启示:认识DBSCAN的异形聚类特点355
13.2Mean-Shift聚类*358
13.2.1什么是核密度估计359
13.2.2核密度估计在Mean-Shift聚类中的意义361
13.2.3Mean-Shift聚类过程362
13.2.4Python模拟与启示:认识Mean-Shift聚类中的核宽363
13.3BIRCH365
13.3.1BIRCH的特点365
13.3.2BIRCH算法中的聚类特征树365
13.3.3BIRCH的基本思路368
13.3.4Python模拟和启示:认识BIRCH的特点370
13.4特色聚类的Python应用实践:批发商的市场细分374
13.4.1数据说明374
13.4.2Python实现375
本章总结377
本章相关函数列表377
本章习题378

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网