您好,欢迎来到聚文网。 登录 免费注册
数据科学基础——基于R与Python的实现

数据科学基础——基于R与Python的实现

  • 字数: 278
  • 出版社: 中国人民大学
  • 作者: 吴喜之 张敏
  • 商品条码: 9787300334660
  • 适读年龄: 12+
  • 版次: 1
  • 页数: 177
  • 出版年份: 2025
  • 印次: 1
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
数据科学是在动态世界 中不断发展变化的。本书旨 在让读者掌握数据科学基础 知识与技能,尽快进入理论 与实践,奠定进一步发展的 基础。 本书精选了5章内容。第 1章为数据初等描述;第2章 介绍传统统计基本思维方式 ,可作为参考;第3章系统 深入地介绍有监督学习基础 ,包括回归及分类概念方法 ,重点介绍决策树;第4章 介绍机器学习组合算法及模 型;第5章详细介绍神经网 络的基本概念。内容聚焦于 决策树、神经网络等既基础 又具扩展功能的方法,未罗 列扩展性不强的方法。 本书支持R和Python两种 编程语言,R代码穿插于正 文,Python代码及说明性R 代码附于每章之后。建议读 者在学习数据科学的过程中 通过处理数据自学编程,培 养自己的编程能力。 本书与教学契合度高, 无论经验丰富的教师,还是 没有机器学习和数理统计教 学经验的教师,都能轻松上 手。其独特的数据驱动教学 方式,能够极大地激发学生 的学习兴趣,促使学生快速 吸收知识,提升学习效果。
作者简介
吴喜之,北京大学数学力学系本科,美国北卡罗莱纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、北卡罗来纳大学以及南开大学、北京大学等多所著名学府执教。
目录
第1章 体现真实世界的数据 1.1 数据:对真实世界的记录 1.1.1 数据和变量 1.1.2 变量的类型 1.1.3 数据中的信息量 1.1.4 总体和样本 1.1.5 矩形数据例子 1.2 变量的逐个描述 1.2.1 数量变量的分位数与盒形图 1.2.2 连续型变量的直方图(密度图) 1.2.3 分类(离散)变量的计数及条形图 1.3 变量关系的描述 1.3.1 离散型变量之间关系的描述 1.3.2 连续型数量变量和其他变量之间关系的描述 1.3.3 成对图 1.4 数据的简单描述可能很肤浅甚至误导 1.4.1 自变量对因变量单独影响的盒形图与密度估计图的对比 1.4.2 可能被忽视的组合影响 1.5 习题 1.6 附录:正文中没有的R代码 1.7 附录:本章的Python代码 1.7.1 1.2节的Python代码 1.7.2 1.3节的Python代码 1.7.3 1.4节的Python代码 第2章 传统统计:参数推断简介 2.1 关于总体均值“的推断t 2.1.1 经典统计推断必须有的假定 2.1.2 经典统计的显著性检验 2.1.3 经典统计总体均值“的置信区间 2.1.4 贝叶斯统计的一些基本概念 2.1.5 贝叶斯统计对例2.1的推断 2.2 关于伯努利试验概率的推断 2.2.1 经典统计的显著性检验 2.2.2 经典统计关于比例p的置信区间 2.2.3 贝叶斯统计对例2.2的推断 2.2.4 贝叶斯最高密度区域 2.3 习题 2.4 附录:本章的Python代码 2.4.1 2.1节的Python代码 2.4.2 2.2节的Python代码 第3章 有监督学习基础 3.1 引言 3.2 简单回归模型初识 3.2.1 回归数据例31的初等描述 3.2.2 简单回归模型拟合 3.2.3 验证和模型比较:交叉验证 3.3 最小二乘线性回归模型 3.3.1 线性回归模型的数学假定 3.3.2 训练模型的标准:平方损失:最小二乘法 3.3.3 分类自变量在线性回归中的特殊地位

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网