您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
机器学习与R语言
装帧: 平装
出版社: 机械工业出版社
作者: (美)兰兹(Brett Lantz) 著;李洪成,许金炜,李舰 译
出版日期: 2015-03-01
商品条码: 9787111491576
版次: 1
开本: 16开
页数: 259
出版年份: 2015
定价:
¥69
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
R本身是一款十分很好的数据分析和数据可视化软件。本书通过将实践案例与核心的理论知识相结合,提供了你开始将机器学习应用到你自己项目中所需要的知识。本书主要内容:机器学习的基本概念和理论,用于机器学习的R软件环境;如何应用R来管理数据,进行数据的探索分析和数据可视化;典型的机器学习算法和案例,并给出了详细的分析步骤;模型性能评价的原理和方法;提高模型性能的几种常用方法;其他机器学习主题。本书适用于任何希望使用数据来采取行动的人。读者只需要具有R的一些基本知识,不需要具备机器学习的深厚基础。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。
作者简介
Brett Lantz,在应用创新的数据方法来理解人类的行为方面有10余年经验。他很初是一名社会学家,在学习一个青少年社交网站分布的大型数据库时,他就开始陶醉于机器学习。从那时起,他致力于移动电话、医疗账单数据和公益活动等交叉学科的研究,并维护dataspeIunking.com这个网站,该网站致力于分享有关探寻数据中所蕴含的洞察的知识。
李洪成,统计学博士,现为上海金融学院副教授,是SPSS统计分析软件和R语言专家。他的研究方向为金融统计和数据挖掘。他曾出版多本著作,并在专业杂志发表多篇论文,代表著作有《SPSS18数据分析基础与实践》、《SPSS数据分析教程》、《时间序列预测实践教程》,译著有《R语言经典实例》、《数据挖掘与R语言》、《金融数据分析导论:基于R语言》等。
目录
推荐序
译者序
前言
致谢
关于技术评审人
第1章机器学习简介1
1.1机器学习的起源2
1.2机器学习的使用与滥用3
1.3机器如何学习5
1.3.1抽象化和知识表达6
1.3.2一般化7
1.3.3评估学习的成功性9
1.4将机器学习应用于数据中的步骤9
1.5选择机器学习算法10
1.5.1考虑输入的数据10
1.5.2考虑机器学习算法的类型11
1.5.3为数据匹配合适的算法13
1.6使用R进行机器学习13
1.7总结17
第2章数据的管理和理解18
2.1R数据结构18
2.2向量19
2.3因子20
2.3.1列表21
2.3.2数据框22
2.3.3矩阵和数组24
2.4用R管理数据25
2.4.1保存和加载R数据结构25
2.4.2用CSV文件导入和保存数据26
2.4.3从SQL数据库导入数据27
2.5探索和理解数据28
2.5.1探索数据的结构29
2.5.2探索数值型变量29
2.5.3探索分类变量37
2.5.4探索变量之间的关系39
2.6总结42
第3章懒惰学习——使用近邻分类44
3.1理解使用近邻进行分类45
3.1.1kNN算法45
3.1.2为什么kNN算法是懒惰的51
3.2用kNN算法诊断乳腺癌51
3.2.1第1步——收集数据51
3.2.2第2步——探索和准备数据52
3.2.3第3步——基于数据训练模型55
3.2.4第4步——评估模型的性能57
3.2.5第5步——提高模型的性能58
3.3总结60
第4章概率学习——朴素贝叶斯分类61
4.1理解朴素贝叶斯61
4.1.1贝叶斯方法的基本概念62
4.1.2朴素贝叶斯算法65
4.2例子——基于贝叶斯算法的手机垃圾短信过滤70
4.2.1第1步——收集数据70
4.2.2第2步——探索和准备数据71
4.2.3数据准备——处理和分析文本数据72
4.2.4第3步——基于数据训练模型78
4.2.5第4步——评估模型的性能79
4.2.6第5步——提升模型的性能80
4.3总结81
第5章分而治之——应用决策树和规则进行分类82
5.1理解决策树82
5.1.1分而治之83
5.1.2C5.0决策树算法86
5.2例子——使用C5.0决策树识别高风险银行贷款89
5.2.1第1步——收集数据89
5.2.2第2步——探索和准备数据89
5.2.3第3步——基于数据训练模型92
5.2.4第4步——评估模型的性能95
5.2.5第5步——提高模型的性能95
5.3理解分类规则98
5.3.1独立而治之99
5.3.2单规则(1R)算法101
5.3.3RIPPER算法103
5.3.4来自决策树的规则105
5.4例子——应用规则学习识别有毒的蘑菇105
5.4.1第1步——收集数据106
5.4.2第2步——探索和准备数据106
5.4.3第3步——基于数据训练模型107
5.4.4第4步——评估模型的性能109
5.4.5第5步——提高模型的性能109
5.5总结111
第6章预测数值型数据——回归方法113
6.1理解回归113
6.1.1简单线性回归115
6.1.2普通最小二乘估计117
6.1.3相关系数118
6.1.4多元线性回归120
6.2例子——应用线性回归预测医疗费用122
6.2.1第1步——收集数据122
6.2.2第2步——探索和准备数据123
6.2.3第3步——基于数据训练模型127
6.2.4第4步——评估模型的性能129
6.2.5第5步——提高模型的性能130
6.3理解回归树和模型树133
6.4例子——用回归树和模型树估计葡萄酒的质量135
6.4.1第1步——收集数据135
6.4.2第2步——探索和准备数据136
6.4.3第3步——基于数据训练模型137
6.4.4第4步——评估模型的性能140
6.4.5第5步——提高模型的性能142
6.5总结144
第7章黑箱方法——神经网络和支持向量机146
7.1理解神经网络146
7.1.1从生物神经元到人工神经元148
7.1.2激活函数148
7.1.3网络拓扑151
7.1.4用后向传播训练神经网络153
7.2用人工神经网络对混凝土的强度进行建模154
7.2.1第1步——收集数据154
7.2.2第2步——探索和准备数据155
7.2.3第3步——基于数据训练模型156
7.2.4第4步——评估模型的性能158
7.2.5第5步——提高模型的性能159
7.3理解支持向量机160
7.3.1用超平面分类161
7.3.2寻找最大间隔161
7.3.3对非线性空间使用核函数164
7.4用支持向量机进行光学字符识别165
7.4.1第1步——收集数据166
7.4.2第2步——探索和准备数据166
7.4.3第3步——基于数据训练模型167
7.4.4第4步——评估模型的性能169
7.4.5第5步——提高模型的性能170
7.5总结171
第8章探寻模式——基于关联规则的购物篮分析172
8.1理解关联规则172
8.2例子——用关联规则确定经常一起购买的食品杂货176
8.2.1第1步——收集数据176
8.2.2第2步——探索和准备数据177
8.2.3第3步——基于数据训练模型183
8.2.4第4步——评估模型的性能184
8.2.5第5步——提高模型的性能187
8.3总结189
第9章寻找数据的分组——k均值聚类191
9.1理解聚类191
9.1.1聚类——一种机器学习任务192
9.1.2k均值聚类算法193
9.1.3用k均值聚类探寻青少年市场细分198
9.1.4第1步——收集数据198
9.1.5第2步——探索和准备数据199
9.1.6第3步——基于数据训练模型202
9.1.7第4步——评估模型的性能204
9.1.8第5步——提高模型的性能206
9.2总结207
第10章模型性能的评价208
10.1度量分类方法的性能208
10.1.1在R中处理分类预测数据209
10.1.2深入探讨混淆矩阵211
10.1.3使用混淆矩阵度量性能212
10.1.4准确度之外的其他性能评价指标214
10.1.5性能权衡的可视化221
10.2评估未来的性能224
10.2.1保持法225
10.2.2交叉验证226
10.2.3自助法抽样229
10.3总结229
第11章提高模型的性能231
11.1调整多个模型来提高性能231
11.2使用元学习来提高模型的性能239
11.2.1理解集成学习239
11.2.2bagging241
11.2.3boosting243
11.2.4随机森林244
11.3总结248
第12章其他机器学习主题249
12.1分析专用数据250
12.1.1用RCurl添加包从网上获取数据250
12.1.2用XML添加包读/写XML格式数据250
12.1.3用rjson添加包读/写JSON251
12.1.4用xlsx添加包读/写MicrosoftExcel电子表格251
12.1.5生物信息学数据251
12.1.6社交网络数据和图数据252
12.2提高R语言的性能252
12.2.1处理非常大的数据集253
12.2.2使用并行处理来加快学习过程254
12.2.3GPU计算257
12.2.4部署最优的学习算法257
12.3总结258
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网