您好,欢迎来到聚文网。 登录 免费注册
Anaconda数据科学实战

Anaconda数据科学实战

  • 字数: 375000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 作者: (美)严玉星,(美)詹姆斯·严(James Yan)
  • 出版日期: 2020-05-01
  • 商品条码: 9787115534507
  • 版次: 1
  • 开本: 16开
  • 页数: 284
  • 出版年份: 2020
定价:¥79 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
1.金融大数据专家带你学习Python利器—Anaconda,了解Anaconda强大的包和各项功能; 2.借助开源免费的Python平台,丰富实用的案例,轻松驾驭金融大数据并解决常见的数据科学难题。
内容简介
Anaconda是一个强大的开源数据科学平台,它将很多好的工具整合在一起,极大地简化了使用者的工作流程,并能够帮助使用者解决一系列数据科学难题。
《Anaconda数据科学实战》旨在通过一系列示例,引导读者在编码和图表中了解Anaconda的强大之处。本书包括12章,结合R、Python、Octave和Julia等4种编程语言,从平台的安装和配置开始,循序渐进地引导读者掌握数据集的获取、数据可视化、统计建模、管理包、Anaconda的优化、无监督学习、监督学习、数据预测分析、云、分布式计算等内容。
本书示例丰富,讲解细致,作者不仅在金融领域有着深厚的积累,还有着丰富的教学经验。对于那些有兴趣了解金融领域数据科学的读者,以及普通的数据分析师或数据科学从业者,本书都是一个不错的选择。在阅读本书之前,我们希望读者具备R或Python的基本编程知识,以及线性代数相关的基本知识。
作者简介
严玉星博士毕业于麦吉尔大学,获得金融学博士学位。他曾在加拿大、新加坡和美国的8 所大学教授各种金融课程,发表23篇研究和教学相关的论文,并著有6本书。此外,他还精通R、Python、SAS、MATLAB、Octave 和C 语言,是金融数据分析方面的专家。 詹姆斯·严当前在多伦多大学攻读计算机科学和统计学双学位。他还精通Python、R、Java、MATLAB 和SQL等。
目录
第1章Anaconda生态系统1
1.1简介1
1.1.1通过Anaconda使用Jupyter的理由2
1.1.2在无须预装的情况下使用Jupyter2
1.2Miniconda5
1.3Anaconda云5
1.4查找帮助6
1.5总结8
1.6问题回顾及练习9
第2章Anaconda安装11
2.1安装Anaconda11
2.2测试Python13
2.3使用IPython14
2.4通过Jupyter使用Python16
2.5Spyder简介17
2.6通过Conda安装R19
2.7安装Julia并链接到Jupyter20
2.8安装Octave并链接到Jupyter21
2.9查找帮助23
2.10总结25
2.11问题回顾及练习25
第3章数据基础27
3.1数据源28
3.2UCI机器学习28
3.3Python包pandas简介31
3.4输入数据的几种方式32
3.4.1使用R输入数据33
3.4.2使用Python输入数据34
3.5Quandl数据分发平台简介36
3.6处理缺失数据39
3.7数据排序42
3.7.1切割数据集45
3.7.2合并不同数据集45
3.7.3数据输出48
3.8Python包cbsodata简介49
3.9Python包datadotworld简介50
3.10R包haven和foreign简介51
3.11R包dslabs简介52
3.12生成Python数据集53
3.13生成R数据集55
3.14总结56
3.15问题回顾及练习56
第4章数据可视化59
4.1数据可视化的重要性59
4.2R数据可视化60
4.3Python数据可视化66
4.4Julia数据可视化69
4.5绘制简单图形71
4.5.1各种条状图、饼图和直方图74
4.5.2添加趋势75
4.5.3添加图解和其他说明76
4.6R可视化包79
4.7Python可视化包81
4.8Julia可视化包82
4.9动态可视化83
4.9.1将图片存储为pdf86
4.9.2将动态可视化存储为HTML文件86
4.10总结87
4.11问题回顾及练习87
第5章在Anaconda中统计建模90
5.1线性模型简介91
5.2在R、Python、Julia和Octave中运行线性回归92
5.3临界值和决策规则96
5.4F检验、临界值和决策规则97
5.5处理缺失数据104
5.5.1清除缺失数据104
5.5.2用其他值替换缺失数据105
5.6检测及处理异常值106
5.7几个多元线性模型108
5.8共线性及其解决方案111
5.9一个模型的性能测量113
5.10总结113
5.11问题回顾及练习113
第6章管理包117
6.1包、模块和工具箱简介118
6.2使用包的两个示例118
6.3查找所有R包123
6.4查找所有Python包124
6.5查找所有Julia包125
6.6查找所有Octave包126
6.7R中的任务视图126
6.8查找手册128
6.9包依赖129
6.10R包管理130
6.11Python包管理132
6.12Julia包管理133
6.13Octave包管理134
6.14包管理器conda135
6.15在R和Python中创建程序集137
6.16查找环境变量138
6.17总结140
6.18问题回顾及练习140
第7章Anaconda的优化142
7.1为何优化很重要142
7.2优化的一般问题144
7.3二次优化148
7.3.1R中的优化149
7.3.2Python中的优化151
7.3.3Julia中的优化153
7.3.4Octave中的优化156
7.4股票投资组合优化159
7.5很优的税收政策161
7.6R中用于优化的包162
7.7Python中用于优化的包164
7.8Octave中用于优化的包165
7.9Julia中用于优化的包165
7.10总结166
7.11问题回顾及练习166
第8章Anaconda中的无监督学习168
8.1无监督学习简介169
8.2层次聚类173
8.3k-均值聚类177
8.4Python包scipy简介179
8.5Python包contrastive简介181
8.6Python包sklearn(scikit-learn)简介181
8.7R包rattle简介185
8.8R包randomUniformForest简介187
8.9R包Rmixmod简介189
8.10Julia实现190
8.11聚类分析的任务视图191
8.12总结192
8.13问题回顾及练习192
第9章Anaconda中的监督学习194
9.1监督学习概览194
9.2分类199
9.2.1k-最近邻算法200
9.2.2贝叶斯分类器202
9.2.3强化学习204
9.3监督学习的R实现205
9.4Python实现209
9.5Octave实现213
9.6Julia实现217
9.7总结219
9.8问题回顾及练习220
第10章数据预测分析:建模和验证223
10.1理解数据预测分析223
10.2有用的数据集224
10.2.1R包AppliedPredictive
Modeling226
10.2.2时间序列分析228
10.3预测未来事件229
10.3.1季节性232
10.3.2可视化组件233
10.3.3R包LiblineaR234
10.3.4R包datarobot236
10.3.5R包eclust236
10.4模型选择238
10.4.1Python包model-catwalk240
10.4.2Python包sklearn240
10.4.3Julia包QuantEcon242
10.4.4Octave包ltfat243
10.5Granger因果关系检验245
10.6总结247
10.7问题回顾及练习247
第11章Anaconda云250
11.1Anaconda云简介250
11.2深入学习JupyterNotebook251
11.2.1JupyterNotebook格式254
11.2.2Notebooks分享256
11.2.3项目分享258
11.2.4环境分享260
11.3复制他人的环境到本地261
11.4总结265
11.5问题回顾及练习265
第12章分布式计算、并行计算和HPCC267
12.1分布式和并行计算简介267
12.1.1并行处理的任务视图268
12.1.2Python示例程序269
12.2理解MPI270
12.2.1R包Rmpi270
12.2.2R包plyr271
12.2.3R包parallel272
12.2.4R包snow276
12.3Python并行处理276
12.3.1单词频率的并行处理278
12.3.2Monte-Carlo期权定价并行处理278
12.4计算节点280
12.5Anaconda附加组件280
12.6HPCC简介281
12.7总结283
12.8问题回顾及练习283

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网