您好,欢迎来到聚文网。 登录 免费注册
R语言数据分析与挖掘实战手册

R语言数据分析与挖掘实战手册

  • 字数: 347千字
  • 装帧: 平装
  • 出版社: 中国铁道出版社有限公司
  • 作者: 程静
  • 出版日期: 2019-06-01
  • 商品条码: 9787113257453
  • 版次: 1
  • 开本: 16开
  • 页数: 264
  • 出版年份: 2019
定价:¥59.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论依据;很后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。
作者简介
程静,毕业于重庆大学,目前就职于西部估值优选的互联网公司猪八戒网,担任不错数据分析工程师,负责行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测,擅长大数据分析及数据挖掘的各种算法熟练使用R语言及Python语言。
目录
章R语言简介11R语言软件的安装与运行1111R语言软件的安装、启动与关闭1112R语言程辑包的安装和使用412R语言的数据结构6121R语言对象和类型6122向量7123数组和矩阵12124列表17125数据框20第2章数据的读取与保存21数据的读取24211读取内置数据集和文本文件24212读取Excel数据和CSV格式的数据30213读取R语言格式数据和网页数据33214读取其他格式的数据3422数据保存36221写出数据36222使用函数cat()37223保存为R语言格式文件38224保存为其他类型文件39第3章数据预处理31缺失值处理40311缺失值判断40312缺失模型判断44313常用处理方法4832数据整理53321数据合并53322选取子集56323数据转换59第4章数据的探索性分析41基本绘图函数6642探索单个变量74421单组数据的图形描述74422单组数据的描述性分析7943探索多个变量81431两组数据的图形描述81432多组数据的图形描述85433多组数据的描述性统计8844其他图像探索90第5章回归分析51一元线性回归94511模型简介94512函数介绍96513综合案例:iris数据集的一元回归建模9752多元线性回归99521模型简介99522综合案例:iris数据集的多元回归建模10053变量的选择105531逐步回归方法简介及函数介绍105532综合案例:swiss数据集的逐步回归建模106533岭回归的方法简介及函数介绍109534综合案例:longley数据集的岭回归探索110535lasso回归方法简介及函数介绍114536综合案例:longley数据集的lasso回归建模11554Logistic回归117541模型简介117542函数介绍119543综合案例:iris数据集的逻辑回归建模120第6章方差分析61单因素方差分析124611模型介绍124612函数介绍126613综合案例:不同治疗方法下胆固醇降低效果的差异性分析12762双因素方差分析130621模型介绍130622综合案例:不同剂量下老鼠妊娠重量的差异性分析13263协方差分析136631模型简介136632函数介绍136633综合案例:hotdog数据集的协方差分析137第7章主成分分析和因子分析71降维的基本方法:主成分分析139711理论基础:原始变量的线性组合139712模型介绍141713函数介绍143714综合案例:longley数据集的变量降维及回归144715综合案例:longley数据集的变量降维及回归(主成分回归)14872推广发展:因子分析150721理论基础:多个变量综合为少数因子150722模型介绍151723函数介绍153724综合案例:能力和智商测试的因子分析探索154第8章判别分析81距离判别法160811理论基础:离谁近,就属于谁160812函数介绍162813综合案例:基于距离判别的iris数据集分类16482Bayes判别法168821理论基础:先验概率与错判损失168822函数介绍170823综合案例:基于iris数据集的Bayes判别分析17183Fisher判别法171831理论基础:投影171832函数介绍173833综合案例:基于Fisher判别的iris数据集分类174第9章常规聚类分析91深入了解聚类分析178911差异与分类178912主流的聚类算法17992动态聚类180921聚类的基本过程180922函数介绍183923综合案例:基于随机生成序列的动态聚类18493层次聚类194931聚类的基本过程194932函数介绍197933综合案例:基于UScitiesD数据集的层次聚类19994密度聚类202941聚类的基本过程202942函数介绍202943综合案例:基于随机生成序列的密度聚类20395EM聚类204951聚类的基本过程205952函数介绍205953综合案例:基于iris数据集的EM聚类2060章关联规则101简单关联规则2101011基本概念与表示形式2101012评价简单关联规则的有效性和实用性211102序列关联规则2121021差异与基本概念2121022生成序列关联规则213103Apriori算法2141031算法介绍:挖掘频繁项集2141032函数介绍2151033综合案例:基于Titanic数据集的关联规则挖掘216104Eclat算法2241041算法介绍:自底向上的搜索2241042函数介绍2241043综合案例:基于美国人口调查数据的关联规则挖掘225105SPADE算法2301051算法介绍:基于序列格的搜索和连接2311052函数介绍2321053综合案例:基于zaki数据集的序列关联规则挖掘2331章神经网络111深入了解人工神经网络2391111生物神经元2401112人工神经元模型2411113人工神经网络种类2441114建立模型的一般步骤247112B-P反向传播网络2481121B-P反向传播网络模型2481122算法介绍2491123函数介绍250113综合案例:基于Boston数据的波士顿郊区房价预测建模252

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网