应用预测建模--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥22.05

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

内容简介

这是一本专注于预测建模的数据分析书，意在为实践者提供预测建模过程的指导，比如如何进行数据预处理、模型调优、预测变量重要性度量、变量选择等。读者可以从中学到许多建模方法以及提高对许多常用的、现代的有效模型的认识，如线性回归、非线性回归和分类模型，涉及树方法、支持向量机等。靠前0章和靠前7章分别研究混凝土混合物的抗压强度和作业调度两个案例。
作者重实际应用，轻数学理论，从实际数据出发，结合开源软件R语言来求解实际问题，详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含书中使用的数据，以及可以用于重复书中每一章分析的R代码，让读者能在一定精度范围内重复本书的结果，并自然地将书中的预测建模方法应用到自己的数据上。章后附有习题，方便读者巩固所学。
这本业界互相推荐的好书，适合所有数据分析人员阅读。

作者简介

马克斯·库恩(Max Kuhn)，康涅狄格州格罗顿市辉瑞优选研发非临床统计部主任，在制药和诊断行业已有近20年应用预测模型的经验，他还是很多R包的作者。
谢尔·约翰逊(Kjell Johnson)，博士，在药物研发和其他行业有近20年统计咨询和预测建模经验，曾任辉瑞优选研发统计部主任。

译者序
前言
第1章导论
1.1预测与解释
1.2预测模型的关键部分
1.3专业术语
1.4实例数据集和典型数据场景
1.5概述
1.6符号
第一部分一般策略
第2章预测建模过程简介
2.1案例分析：预测燃油效能
2.2主题
2.3总结
第3章数据预处理
3.1案例分析：高内涵筛选中的细胞分组
3.2单个预测变量数据变换
3.3多个预测变量数据变换
3.4处理缺失值
3.5移除预测变量
3.6增加预测变量
3.7区间化预测变量
3.8计算
习题
第4章过度拟合与模型调优
4.1过度拟合的问题
4.2模型调优
4.3数据分割
4.4重抽样技术
4.5案例分析：信用评分
4.6选择调优参数值
4.7数据划分建议
4.8不同模型间的选择
4.9计算
习题
第二部分回归模型
第5章衡量回归模型的效果
5.1模型效果的定量度量
5.2方差偏差的权衡
5.3计算
第6章线性回归及其扩展
6.1案例分析：定量构效关系建模
6.2线性回归
6.3偏最小二乘法
6.4惩罚模型
6.5计算
习题
第7章非线性回归模型
7.1神经网络
7.2多元自适应回归样条
7.3支持向量机
7.4K近邻
7.5计算
习题
第8章回归树与基于规则的模型
8.1简单回归树
8.2回归模型树
8.3基于规则的模型
8.4装袋树
8.5随机森林
8.6助推法
8.7Cubist
8.8计算
习题
第9章溶解度模型总结
第10章案例研究：混凝土混合物的抗压强度
10.1模型构建策略
10.2模型性能
10.3优化抗压强度
10.4计算
第三部分分类模型
第11章分类模型的效果度量
11.1类预测
11.2评估预测类
11.3评估类概率
11.4计算
第12章判别分析和其他线性分类模型
12.1案例分析：预测是否成功申请经费
12.2逻辑回归
12.3线性判别分析
12.4偏最小二乘判别分析
12.5惩罚模型
12.6最近收缩质心
12.7计算
习题
第13章非线性分类模型
13.1非线性判别分析
13.2神经网络
13.3灵活判别分析
13.4支持向量机
13.5K近邻
13.6朴素贝叶斯
13.7计算
习题
第14章分类树与基于规则的模型
14.1基本的分类树
14.2基于规则的模型
14.3装袋决策树
14.4随机森林
14.5助推法
14.6C5.0
14.7比较两种分类预测变量编码方式
14.8计算
习题
第15章经费申请模型的总结
第16章对严重类失衡的补救方法
16.1案例分析:预测房车保险所有权
16.2类失衡的影响
16.3模型调优
16.4选择截点
16.5调整先验概率
16.6不等案例权重
16.7抽样方法
16.8成本敏感度训练
16.9计算
习题
第17章案例研究：作业调度
17.1数据切分和模型策略
17.2结果
17.3计算
第18章衡量预测变量重要性
18.1数值结果变量
18.2分类结果变量
18.3其他方法
18.4计算
习题
第19章特征选择介绍
19.1使用无信息预测变量的结果
19.2减少预测变量个数的方法
19.3绕封法
19.4过滤法
19.5选择偏差
19.6案例分析：预测认知损伤
19.7计算
习题
第20章影响模型表现的因素
20.1第Ⅲ类错误
20.2结果变量的测量误差
20.3预测变量的测量误差
20.4连续变量离散化
20.5模型预测何时是可信的
20.6大样本的影响
20.7计算
习题
附录
附录A各种模型的总结
附录BR语言介绍
附录C值得关注的网站
参考文献

摘要

前言这是一本关于数据分析的书，专注于预测建模的实际应用。“预测建模”一词可能让人联想起诸如机器学习、模式识别和数据挖掘。事实上，这样的联想是很自然的，这些专业名词指代的方法是预测建模整体过程的一部分。但是预测建模所涵盖的范围远大于发现数据模式的工具和技术。应用预测建模定义了这样一个建立模型的过程，我们能理解和量化模型对未来即将看到的数据的预测准确度。本书的核心内容就是其中的整个过程。
    本书意在为实践者提供预测建模过程的指导，读者可以从阅读中学到许多（建模）方法以及提高对许多常用的、现代的有效模型的认识。我们会介绍许多统计和数学技术，但在任何情况下我们描述技术细节的动机都是帮助读者理解模型的优缺点，而非（单纯）数理统计知识。我们极力避免复杂的公式，但是有少数例外。关于预测模型的理论知识，推荐这两本书，即Hastie等(2008)和Bishop (2006)。本书的读者需要有一些基本的统计学知识，包括方差、相关性、简单线性回归以及基本的统计假设检验（如p值和检验统计量）。
    预测建模的过程本质上具有很强的应用实践性。但我们研究发现，很多文章、出版物不能让读者再现（他们的）建模结果，因为数据不公开，或读者无法使用相应软件，又或软件需付费。Buckheit和Donoho(1995)对传统学术界提出了相似的批评：
    一篇发表于科学刊物上关于计算机科学的文章本身不是学术，仅是关于学术的广告。真正的学术是完整的软件开发环境和能够生成那些图的所有指令集。
    因此，我们的目标是尽可能地具有实践应用性，让读者能在一定精度范围内重复本书的结果，且可以自然地将书中的预测建模方法应用到他们自己的数据上。再者，对于整个建模过程，我们使用R语言(Ihaka和Gentleman 1996; R Development Core Team 2010),这是一个用于数学和统计计算的免费软件。几乎所有例子中的数据集都可以在相应R包中找到。R包AppliedPredictiveModeling包含了书中使用的很多数据，以及可以用于再现书中每一章分析结果的R代码。
    我们选择R作为计算引擎有如下几个原因。首先R是免费的（虽然也有商业版的R），可以在不同的操作系统上使用。其次，它在通用公共许可（General Public License）下发行(免费软件基金2007年6月)，该许可阐明程序再次发布的规则。在此构架下，任何人可以任意检查、修改源程序。由于开源特性，很多预测模型已经由R包可以实现。再者R有进行预测建模的大量强大的功能。不熟悉R的读者可以在网上找到大量的入门教程（见附录）。
    由于篇幅所限，本书没有涵盖广义加性模型、模型集成、网络模型、时间序列等内容。
    本书还有一个配套网站：
    http://appliedpredictivemodeling.com/其中含有一些相关内容。
    没有如下这些人的指导和帮助不会有本书的问世：Walter H Carter, Jim Garrett,Chris Gennings, Paul Harms, Chris Keefer, William Klinger, Daijin Ko, Rich Moore, David Neuhouser, David Potter, David Pyne, William Rayens, Arnold Stromberg和Thomas Vidmar。我们还要感谢Ross Quinlan对Cubist和 C50部分的帮助，他们帮我们修正了这两部分的一些描述。我们还要感谢Springer出版社的Marc Strauss和Hannah Bracken以及审阅者Vini Bonato、Thomas Miller、Ross Quinlan、Eric Siegel、Stan Young和一位匿名审阅者。最后我们要感谢家人的支持：Miranda Kuhn, Stefan Kuhn, Bobby Kuhn, Robert Kuhn, Karen Kuhn 和Mary Ann Kuhn; Warren和Kay Johnson，Valerie和Truman Johnson。
    Max KuhnKjell Johnson

应用预测建模

库存： {{selectedSku?.stock}} 库存充足

上架到店铺