您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
数据挖掘 基于R语言的实战 微课版
字数: 403000
装帧: 平装
出版社: 人民邮电出版社
作者: 张俊妮
出版日期: 2021-01-01
商品条码: 9787115542786
版次: 1
开本: 16开
页数: 272
出版年份: 2021
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
1.本书是北京大学光华管理学院“数据挖掘与应用”课程教材。 2.本书作者被誉为“哈佛小魔女”,中科院少年班天才统计学家,张俊妮教授十年一剑之作。 3.全书案例丰富,涵盖医疗、金融、营销、保险、政府部门等应用案例。 4.提供全套教学解决方案,推动“数据挖掘”课程的建设和发展。
内容简介
本书以深入浅出的语言系统地介绍了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与R语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较、R语言数据挖掘大案例。本书使用基于R语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用R语言进行数据挖掘。本书可作为高等院校数据分析与数据挖掘课程的教材,也适合有意学习并使用数据挖掘基本技术的本科生、研究生以及业界人士阅读。
目录
第1章 数据挖掘与R语言概述
1.1 数据挖掘的定义及基本流程
1.2 关于数据挖掘项目的3个基本问题
1.2.1 建模数据集对预测数据集的代表性
1.2.2 自变量和因变量之间关系的因果性解释
1.2.3 模型预测精度对于实际应用的价值
1.3 CRISP-DM数据挖掘方法论
1.4 SEMMA数据挖掘方法论
1.5 R语言简介
习题
第2章 数据理解
2.1 收集初始数据
2.2 描述数据
2.2.1 数据的准确含义
2.2.2 数据粒度
2.2.3 变量类型
2.2.4 冗余变量
2.2.5 缺省值
2.2.6 数据链接
2.3 检查数据质量
2.3.1 抽样偏差
2.3.2 数据取值检查
2.3.3 数据缺失模式
2.4 初步探索数据
2.5 R语言分析示例:数据理解
上机实验
习题
第3章 数据准备
3.1 数据整合
3.2 处理分类自变量
3.3 处理时间信息
3.4 清除变量
3.5 处理异常值
3.6 处理极值
3.7 处理缺失数据
3.8 过抽样与欠抽样
3.9 降维
3.9.1 变量选择
3.9.2 主成分分析
3.10 R语言分析示例:数据准备
3.10.1 数据整合
3.10.2 其他数据准备
上机实验
习题
第4章 关联规则挖掘
4.1 关联规则的基本概念
4.2 Apriori算法简介
4.3 序列关联规则挖掘
4.4 R语言分析示例:关联规则挖掘
4.4.1 购物篮分析
4.4.2 泰坦尼克号存活情况分析
上机实验
习题
第5章 聚类分析
5.1 观测之间的距离度量
5.2 k均值聚类法
5.3 层次聚类法
5.3.1 层次聚类法的具体步骤
5.3.2 类别之间距离的度量
5.4 确定很优类别数
5.5 R语言分析示例:聚类
上机实验
习题
第6章 线性模型与广义线性模型
6.1 线性模型
6.1.1 模型假设与估计
6.1.2 模型解释
6.1.3 一些理论结果
6.1.4 模型诊断
6.2 广义线性模型
6.2.1 广义线性模型简介
6.2.2 因变量为二值变量或比例的情形
6.2.3 因变量为多种取值的定类变量的情形
6.2.4 因变量为定序变量的情形
6.2.5 其他情形
6.3 线性模型与广义线性模型中的变量选择
6.3.1 逐步回归
6.3.2 LASSO
6.4 R语言分析示例:线性模型与广义线性模型
6.4.1 线性模型示例
6.4.2 逻辑回归及Lasso示例:印第安女性糖尿病数据
6.4.3 逻辑回归及Lasso示例:移动运营商数据
上机实验
习题
第7章 神经网络的基本方法
7.1 神经元及神经网络介绍
7.1.1 单个神经元
7.1.2 多层感知器架构
7.2 神经网络模型训练
7.2.1 误差函数
7.2.2 神经网络训练算法
7.3 提高神经网络模型的泛化能力
7.4 数据预处理
7.5 R语言分析示例:神经网络
7.5.1 红葡萄酒数据
7.5.2 移动运营商数据
上机实验
习题
第8章 决策树
8.1 决策树简介
8.2 决策树建模过程
8.2.1 决策树建模的一般过程
8.2.2 分类树的建模过程
8.2.3 回归树的建模过程
8.3 决策树的优缺点
8.3.1 决策树的优点
8.3.2 决策树的缺点
8.4 R语言分析示例:决策树
上机实验
习题
第9章 基于决策树的模型组合
9.1 袋装决策树
9.2 梯度提升决策树
9.3 随机森林
9.4 贝叶斯可加回归树
9.5 R语言分析示例:基于决策树的模型组合
9.5.1 袋装决策树示例
9.5.2 梯度提升决策树示例
9.5.3 随机森林示例
9.5.4 贝叶斯可加回归树示例
9.5.5 模型结果总结
上机实验
习题
第10章 模型评估与比较
10.1 因变量为二值变量
10.2 因变量为多种取值的分类变量
10.3 因变量为连续变量
10.4 R语言分析示例:模型评估与比较
上机实验
习题
第11章 R语言数据挖掘大案例
11.1 数据理解与数据准备
11.2 建模及模型评估
习题
参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网