您好,欢迎来到聚文网。 登录 免费注册
机器学习与R语言(原书第3版)

机器学习与R语言(原书第3版)

  • 出版社: 机械工业
  • 作者: [美]布雷特·兰茨(Brett Lantz)
  • 商品条码: 9787111684572
  • 版次: 1
  • 开本: 16开
  • 页数: 294
  • 出版年份: 2021
  • 印次: 1
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书共12章:第1章介绍机器学习的基本概念和理论,并介绍用于机器学习的R软件环境的准备;第2章介绍如何应用R来管理数据,进行数据的探索分析和数据可视化;第3~9章介绍典型的机器学习算法,包括k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类,并给出大量的实际案例和详细的分析步骤,例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等;第10章介绍模型性能评价的原理和方法;第11章给出提高模型性能的几种常用方法;第12章讨论用R进行机器学习时可能遇到的一些高级专题,如特殊形式的数据、大数据集的处理、并行计算和GPU计算等技术。<br><br>
目录
译者序<br/>前 言<br/>第1章 机器学习简介 1<br/>1.1 机器学习的起源 1<br/>1.2 机器学习的使用与滥用 2<br/>1.2.1 机器学习的成功应用 3<br/>1.2.2 机器学习的限制 4<br/>1.2.3 机器学习的伦理方面 5<br/>1.3 机器如何学习 7<br/>1.3.1 数据存储 8<br/>1.3.2 抽象化 8<br/>1.3.3 一般化 10<br/>1.3.4 评估 11<br/>1.4 实践中的机器学习 12<br/>1.4.1 输入数据的类型 13<br/>1.4.2 机器学习算法的类型 14<br/>1.4.3 为输入数据匹配算法 15<br/>1.5 使用R进行机器学习 16<br/>1.5.1 安装R添加包 17<br/>1.5.2 载入和卸载R添加包 18<br/>1.5.3 安装RStudio 18<br/>1.6 总结 19<br/>第2章 管理和理解数据 20<br/>2.1 R数据结构 20<br/>2.1.1 向量 20<br/>2.1.2 因子 22<br/>2.1.3 列表 23<br/>2.1.4 数据框 25<br/>2.1.5 矩阵和数组 27<br/>2.2 用R管理数据 28<br/>2.2.1 保存、载入和移除R数据结构 29<br/>2.2.2 从CSV文件导入数据和将数据保存为CSV文件 29<br/>2.3 探索和理解数据 31<br/>2.3.1 探索数据的结构 31<br/>2.3.2 探索数值变量 32<br/>2.3.3 探索分类变量 40<br/>2.3.4 探索变量之间的关系 41<br/>2.4 总结 44<br/>第3章 懒惰学习——使用近邻分类 46<br/>3.1 理解近邻分类 46<br/>3.1.1 k近邻算法 47<br/>3.1.2 为什么k-NN算法是懒惰的 52<br/>3.2 例子—用k-NN算法诊断乳腺癌 53<br/>3.2.1 第1步—收集数据 53<br/>3.2.2 第2步—探索和准备数据 54<br/>3.2.3 第3步—基于数据训练模型 57<br/>3.2.4 第4步—评估模型的性能 58<br/>3.2.5 第5步—提高模型的性能 59<br/>3.3 总结 61<br/>第4章 概率学习——朴素贝叶斯分类 62<br/>4.1 理解朴素贝叶斯 62<br/>4.1.1 贝叶斯方法的基本概念 63<br/>4.1.2 朴素贝叶斯算法 67<br/>4.2 例子—基于贝叶斯算法的手机垃圾短信过滤 72<br/>4.2.1 第1步—收集数据 72<br/>4.2.2 第2步—探索和准备数据 73<br/>4.2.3 第3步—基于数据训练模型 84<br/>4.2.4 第4步—评估模型的性能 85<br/>4.2.5 第5步—提高模型的性能 86<br/>4.3 总结 87<br/>第5章 分而治之——应用决策树和规则进行分类 88<br/>5.1 理解决策树 88<br/>5.1.1 分而治之 89<br/>5.1.2 C5.0决策树算法 92<br/>5.2 例子—使用C5.0决策树识别高风险银行贷款 95<br/>5.2.1 第1步—收集数据 95<br/>5.2.2 第2步—探索和准备数据 95<br/>5.2.3 第3步—基于数据训练模型 98<br/>5.2.4 第4步—评估模型的性能 100<br/>5.2.5 第5步—提高模型的性能 100<br/>5.3 理解分类规则 104<br/>5.3.1 独立而治之 104<br/>5.3.2 1R算法 106<br/>5.3.3 RIPPER算法 108<br/>5.3.4 来自决策树的规则 109<br/>5.3.5 什么使决策树和规则贪婪 110<br/>5.4 例子—应用规则学习算法识别有毒的蘑菇 111<br/>5.4.1 第1步—收集数据 111<br/>5.4.2 第2步—探索和准备数据 112<br/>5.4.3 第3步—基于数据训练模型 112<br/>5.4.4 第4步—评估模型的性能 114<br/>5.4.5 第5步—提高模型的性能 115<br/>5.5 总结 117<br/>第6章 预测数值型数据——回归方法 118<br/>6.1 理解回归 118<br/>6.1.1 简单线性回归 120<br/>6.1.2 普通最小二乘估计 122<br/>6.1.3 相关性 123<br/>6.1.4 多元线性回归 124<br/>6.2 例子—应用线性回归预测医疗费用 127<br/>6.2.1 第1步—收集数据 128<br/>6.2.2 第2步—探索和准备数据 128<br/>6.2.3 第3步—基于数据训练模型 132<br/>6.2.4 第4步—评估模型的性能 134<br/>6.2.5 第5步—提高模型的性能 135<br/>6.2.6 第6步—用回归模型进行预测 138<br/>6.3 理解回归树和模型树 140<br/>6.4 例子—用回归树和模型树估计葡萄酒的质量 142<br/>6.4.1 第1步—收集数据 142<br/>6.4.2 第2步—探索和准备数据 143<br/>6.4.3 第3步—基于数据训练模型 144<br/>6.4.4 第4步—评估模型的性能 147<br/>6.4.5 第5步—提高模型的性能 149<br/>6.5 总结 151<br/>第7章 黑箱方法—神经网络和支持向量机 152<br/>7.1 理解神经网络 152<br/>7.1.1 从生物神经元到人工神经元 153<br/>7.1.2 激活函数 154<br/>7.1.3 网络拓扑 156<br/>7.1.4 用后向传播训练神经网络 159<br/>7.2 例子—用人工神经网络对混凝土的强度进行建模 160<br/>7.2.1 第1步—收集数据 161<br/>7.2.2 第2步—探索和准备数据 161<br/>7.2.3 第3步—基于数据训练模型 162<br/>7.2.4 第4步—评估模型的性能 164<br/>7.2.5 第5步—提高模型的性能 165<br/>7.3 理解支持向量机 169<br/>7.3.1 用超平面分类 169<br/>7.3.2 对非线性空间使用核函数 173<br/>7.4 例子—用支持向量机进行光学字符识别 175<br/>7.4.1 第1步—收集数据 175<br/>7.4.2 第2步—探索和准备数据 176<br/>7.4.3 第3步—基于数据训练模型 177<br/>7.4.4 第4步—评估模型的性能 179<br/>7.4.5 第5步—提高模型的性能 180<br/>7.5 总结 182<br/>第8章 探寻模式——基于关联规则的购物篮分析 183<br/>8.1 理解关联规则 183<br/>8.1.1 用于关联规则学习的Apriori算法 184<br/>8.1.2 度量规则兴趣度—支持度和置信度 185<br/>8.1.3 用Apriori原则建立规则 186<br/>8.2 例子—用关联规则确定经常一起购买的食品杂货 187<br/>8.2.1 第1步—收集数据 187<br/>8.2.2 第2步—探索和准备数据 188<br/>8.2.3 第3步—基于数据训练模型 193<br/>8.2.4 第4步—评估模型的性能 195<br/>8.2.5 第5步—提高模型的性能 197<br/>8.3 总结 200<br/>第9章 寻找数据的分组——k均值聚类 201<br/>9.1 理解聚类 201<br/>9.1.1 聚类—一种机器学习任务 202<br/>9.1.2 k均值聚类算法 203<br/>9.2 例子—用k均值聚类探寻青少年市场细分 209<br/>9.2.1 第1步—收集数据 209<br/>9.2.2 第2步—探索和准备数据 210<br/>9.2.3 第3步—基于数据训练模型 213<br/>9.2.4 第4步—评估模型的性能 215<br/>9.2.5 第5步—提高模型的性能 217<br/>9.3 总结 219<br/>第10章 模型性能的评估 220<br/>10.1 度量分类方法的性能 220<br/>10.1.1 理解分类器的预测 221<br/>10.1.2 深入探讨混淆矩阵 224<br/>10.1.3 使用混淆矩阵度量性能 225<br/>10.1.4 准确率之外的其他性能度量指标 226<br/>10.1.5 使用ROC曲线可视化性能权衡 233<br/>10.2 评估未来的性能 237<br/>10.3 总结 242<br/>第11章 提高模型的性能 243<br/>11.1 调整多个模型来提高性能 243<br/>11.2 使用元学习来提高模型的性能 251<br/>11.2.1 理解集成学习 251<br/>11.2.2 bagging 253<br/>11.2.3 boosting 254<br/>11.2.4 随机森林 256<br/>11.3 总结 261<br/>第12章 其他机器学习主题 262<br/>12.1 管理和准备真实数据 262<br/>12.1.1 使用tidyverse添加包使数据变得“整洁” 263<br/>12.1.2 读取和写入外部数据文件 265<br/>12.1.3 查询SQL数据库中的数据 266<br/>12.2 处理在线数据和服务 270<br/>12.2.1 下载网页的所有文本 270<br/>12.2.2 解析网页中的数据 271<br/>12.3 处理特定领域的数据 277<br/>12.3.1 分析生物信息学数据 277<br/>12.3.2 分析和可视化网络数据 277<br/>12.4 提高R语言的性能 280<br/>12.4.1 处理非常大的数据集 281<br/>12.4.2 使用并行计算来加快学习过程 283<br/>12.4.3 部署优化的学习算法 290<br/>12.4.4 GPU计算 292<br/>12.5 总结 294

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网