您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
R语言实战
字数: 467千字
装帧: 平装
出版社: 电子工业出版社
作者: 李倩星 编著
出版日期: 2016-03-01
商品条码: 9787121281150
版次: 1
开本: 16开
页数: 408
出版年份: 2016
定价:
¥75
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
李倩星编著的这本《R语言实战(编程基础统计分析与数据挖掘宝典)》是一本很好的R语言入门读物,它旨在帮助读者迅速构建起与数据分析相关的知识体系,并学习如何使用R软件实现数据分析方法。无论有无编程基础或数学基础,本书都能帮助读者成长为一名合格的数据分析师。本书全面介绍了来自统计分析、机器学习、人工智能等领域的多种数据分析算法,在讲解与之相关的R代码时,还讨论了这些算法的原理、优缺点与适用背景。本书按照由易到难的原则组织章节主题,读者将获得优选的阅读体验。通过阅读本书,读者将对R语言在数据分析领域的应用有一个全面的认识。这种认识不被特定行业所局限,任何行业的读者都能利用本书介绍的数据分析方法解决本行业的数据分析问题。
作者简介
李倩星,毕业于西南大学统计系。擅长操作包括SPSS在内的多种数据分析软件。通晓多种数据分析算法的原理与应用,并能利用其解决实际问题。曾在大数据培训机构PPV课程做答疑老师,指导多人找到适合自己发展的大数据之路。时刻关注着大数据行业的近期新动态,深度分析过大数据行业近期新的商业案例,掌握了案例背后的大数据算法原理及其应用商机。
目录
第1章R的基本介绍1
1.1强大的R1
1.2R的安装与启动2
1.2.1安装并启动R3
1.2.2安装并启动一个IDE5
1.3R的向量、矩阵和数组6
1.3.1向量的操作方法和固有属性6
1.3.2矩阵的操作和运算9
1.3.3数组中的维度函数12
1.4R的列表和数据框14
1.4.1列表的特性和编辑方法14
1.4.2数据框的创建和基本操作18
1.5R数据文件的载入和载出20
1.5.1结构化纯文本文件的读取和输出21
1.5.2其他文件的读取和输出23
1.6向R中安装包25
第2章原始数据的探索与预处理29
2.1度量数据集的集中程度29
2.2度量数据集的分散程度31
2.2.1极值、方差和标准差31
2.2.2标准误和偏度系数、峰度系数33
2.3创建一个数值摘要表35
2.4异常值的观测与说明37
2.4.1利用箱线图观测异常值并处理38
2.4.2异常值检测的其他情况和说明40
2.5缺失值的填补与处理42
2.5.1删除缺失值或对其进行简单填补42
2.5.2按照相关性对空缺值进行填补45
第3章R的数据可视化47
3.1plot()函数和常用的图形参数47
3.1.1设置plot()函数中的参数47
3.1.2修改散点图的坐标并加入标注51
3.2经典的基础图形及用途54
3.2.1线图54
3.2.2直方图59
3.2.3箱线图和茎叶图63
3.3将图形组合起来66
3.4更多的高水平作图函数69
3.5更多的常用作图命令72
第4章R中参数的估计和检验75
4.1使用R进行点估计和区间估计75
4.1.1简单的点估计和区间估计75
4.1.2估计单侧置信区间79
4.2与正态总体有关的参数检验83
4.3列联表与独立性检验87
4.4几种检验数据分布的函数89
4.5对非正态总体的区间估计和检验92
4.5.1非正态总体的区间估计92
4.5.2非参数检验中的符号检验94
4.5.3非参数检验中的秩检验96
第5章R中的方差分析99
5.1方差分析模型的建立99
5.2单因素方差分析100
5.2.1单因素方差分析的数学思想与模型101
5.2.2检验样本是否满足方差分析的假设条件102
5.2.3构建单因素方差分析模型105
5.3多因素方差分析108
5.3.1多因素方差分析的数学思想与模型108
5.3.2不考虑交互作用的双因素方差分析110
5.3.3考虑交互作用的双因素方差分析112
5.4秩检验和协方差分析114
5.4.1对控制变量应用秩检验方法114
5.4.2协方差分析的假设与应用116
第6章R中的相关分析和回归分析118
6.1多种相关系数的度量和分析118
6.1.1简单相关系数的计算和检验118
6.1.2散布矩阵图和偏相关系数121
6.1.3典型相关分析123
6.2线性回归分析及其常规参数125
6.2.1对数据进行预处理126
6.2.2构建第一个回归模型127
6.2.3修正方程并检验残差129
6.3使用逐步回归筛选自变量132
6.3.1逐步回归的思想与分类132
6.3.2构建逐步回归模型133
6.4哑变量和逻辑回归135
6.4.1哑变量和逻辑回归的思想135
6.4.2向线性回归模型中纳入哑变量137
第7章更高级的数据可视化140
7.1基础图形的拓展与延伸140
7.1.1绘制分类散点图并添加图标140
7.1.2绘制含多种类别的密度分布图143
7.1.3复合条形图和堆栈条形图146
7.2有关多元分布函数的特殊图形149
7.2.1星图和脸谱图150
7.2.2轮廓图153
7.2.3调和曲线图155
7.3建立最简单的3D图形157
7.4如何让图形更美观160
7.5更多的绘图包和系统162
第8章R中的聚类分析和判别分析164
8.1几种聚类分析的异同164
8.2使用R实现KNN聚类165
8.2.1KNN算法的思想和模型165
8.2.2使用R实现KNN聚类167
8.3使用R实现系统聚类170
8.3.1系统聚类的思想和模型170
8.3.2使用R实现系统聚类171
8.4使用R实现快速聚类174
8.4.1快速聚类的思想和模型174
8.4.2使用R实现快速聚类176
8.5几种判别分析模型综述178
8.5.1距离判别模型179
8.5.2Fisher判别模型182
第9章R中的主成分分析和因子分析186
9.1主成分分析的实现与应用186
9.1.1主成分分析的模型假设和数据处理186
9.1.2构造一个主成分分析模型189
9.1.3计算主成分的综合得分191
9.2因子分析的初次构建与完善193
9.2.1构造一个简单的因子分析模型194
9.2.2计算因子得分并分析196
9.3对因子分析模型进行修正198
9.3.1修改因子分析模型中的因子个数198
9.3.2基于主成分法和主轴因子法进行因子分析200
9.4在降维分析的基础上进行回归分析和聚类分析202
9.4.1在降维分析的基础上进行回归分析202
9.4.2在降维分析的基础上进行聚类分析206
第10章R中的广义线性回归模型209
10.1一般的广义线性回归模型209
10.1.1使用二次函数拟合线性回归模型209
10.1.2拟合更多的广义线性模型212
10.1.3比较线性模型的优劣214
10.2Logistic线性回归模型217
10.2.1Logistic模型的原理与构建方法217
10.2.2Logistic模型的显著性检验和优势比220
10.2.3修正被警告的Logistic模型221
10.3泊松回归分析模型224
10.3.1拟合第一个泊松回归模型224
10.3.2泊松回归模型的过散布检验228
10.4广义线性模型的交叉验证230
第11章R中的时间序列模型233
11.1将数据转换为时间序列格式233
11.1.1使用ts()函数转换数据格式并绘制时间序列曲线233
11.1.2使用zoo()函数转换数据格式并绘制时间序列曲线236
11.2分解时间序列并检验时间序列的自相关性239
11.2.1使用经典方法分解时间序列239
11.2.2使用STL方法分解时间序列241
11.3探究时间序列的自相关性243
11.3.1使用月图和季度图探究自相关性243
11.3.2使用散点图探究自相关性245
11.4构建时间序列并预测248
11.4.1均值预测、单纯预测和漂移248
11.4.2不考虑长期趋势和季节波动的简单指数平滑251
11.4.3在指数平滑中加入长期趋势和季节波动253
11.4.4自回归移动平均模型256
第12章R中的最优化问题259
12.1最优化问题简述259
12.2黄金分割法260
12.2.1黄金分割法和局部最优解261
12.2.2使用R实现黄金分割法263
12.3牛顿最优化方法265
12.3.1牛顿方法的算法原理265
12.3.2在一维情形下实现牛顿迭代法267
12.3.3在多维情形下实现牛顿迭代法270
12.4最快上升法272
12.4.1利用梯度求解上升最快的相邻点272
12.4.2构建最快上升法函数并检验274
12.5R中的最优化函数276
第13章使用R绘制地理信息图形279
13.1绘制世界、国家、省市地图279
13.1.1使用map()函数绘制地图279
13.1.2另一种绘制地图的方法281
13.1.3分省市绘制地图284
13.2向地图中添加颜色288
13.2.1向地图中添加颜色前的准备工作288
13.2.2在地图上添加颜色290
13.3向地图中添加标签和线条292
13.3.1向地图中添加标签前的准备工作293
13.3.2在地图上添加标签295
13.3.3在地图上添加线条298
13.4使用其他格式的文件优化地图300
第14章使用R构建支持向量机305
14.1构建一个简单的支持向量机305
14.1.1支持向量机的算法原理305
14.1.2构建一个简单的支持向量机308
14.1.3使用其他核函数构建支持向量机311
14.2优化支持向量机的参数315
14.2.1优化参数degree315
14.2.2优化参数cost318
14.2.3优化参数gamma321
14.3比较支持向量机与Logistic回归的优劣325
14.4比较支持向量机和KNN聚类算法的优劣329
第15章实现更高效的流程控制和高级循环332
15.1R中的流程控制332
15.1.1if语句的多种实现方法332
15.1.2ifelse语句与花括号的结合334
15.1.3适合多分支情况的switch语句336
15.2R中的for循环、while循环和repeat循环339
15.2.1R中的for循环和while循环339
15.2.2R中的repeat循环341
15.3apply家族中的循环函数344
15.3.1R中的apply()函数344
15.3.2R中的lapply()函数和sapply()函数348
15.3.3R中的tapply()函数351
15.3.4R中的mapply()函数354
15.4更多的高级循环函数357
15.4.1R中的replicate()函数和sweep()函数357
15.4.2R中的aggregate()函数360
第16章R代码的调试与优化364
16.1R代码的常见信息与警告364
16.1.1R代码的正常信息与警告364
16.1.2R代码中的警告处理方法366
16.2R代码中的错误与错误处理方法369
16.2.1使用try()函数处理错误信息369
16.2.2将try()函数与循环相结合371
16.3调试R代码373
16.3.1查看调用栈或暂停代码373
16.3.2修改error选项375
16.4向量化编程方法377
16.4.1向量化编程思想377
16.4.2比较循环和向量的运行速度378
第17章构建电影评分预测模型381
17.1获取数据并探索381
17.2利用recommenderlab包处理数据384
17.3建立模型并评估387
17.3.1模型的选择与建立387
17.3.2模型之间的比较和评估389
第18章贝叶斯垃圾邮件过滤器模型393
18.1贝叶斯模型中的条件概率393
18.2复杂的数据预处理过程395
18.2.1利用for循环读入多封邮件正文395
18.2.2利用tm包进一步转换数据格式397
18.2.3将TDM转换成真正有用的数据框399
18.3利用occurrece值构造分类器402
18.3.1完成理论准备并处理测试邮件和普通邮件402
18.3.2创建一个函数用于比较概率405
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网