您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
R高性能编程
字数: 224000.0
装帧: 平装
出版社: 电子工业出版社
作者: 利姆(Aloysius Lim),William Tjhi 著;唐李洋 译 著
出版日期: 2015-12-01
商品条码: 9787121273964
版次: 1
开本: 16开
页数: 144
出版年份: 2015
定价:
¥55
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
R语言是专门为统计学和数据分析开发的解释型语言,主要用于数学建模、统计计算、数据处理、可视化等几个方面。近年来,受大数据的影响,R语言备受业界追捧。与此同时,工业界和学术界都越来越要求R具备高效分析和处理大规模数据的能力。但是,由于R本身的设计问题,它能够有效处理的数据规模和计算复杂度有限。
为此,利姆、William Tjhi编著的《R高性能编程:用整套解决方案与高超技巧突破性能瓶颈》这本书提供了较为完整的参考方案和技术指南。本书首先解释了CPU、内存和磁盘I/O等影响R性能的三个因素,剖析了R在处理大规模数据时出现性能瓶颈的原因。在理解了R的设计原理及其性能限制的基础之上,本书给出了提升R性能的方法和技术。例如:尽量使用向量化运算避免不必要的计算开销,预分配内存避免不必要的动态内存分配,使用编译代码减少CPU时间,删除不必要的中间数据释放内存占用,通过运行时计算代替永久存储减少内存使用,使用内存映射文件处理大型数据集,使用并行计算技术优化代码,以及接入数据库处理工具,等等。最后,本书提供了如何在R中使用Hadoop的方法,以处理和分析大数据。
作者简介
Aloysius Lim:擅长将复杂的数据和模型表述为简单易懂的见解。作为About People的联合创办者、数据科学家及设计顾问,他喜欢解决问题,以及帮助他人寻找利用数据解决业务难题的实践方案。在政府、教育和零售行业长达7年的丰富经验,造就了他寻找具有创造性的解决办法的独特视角。
衷心地感谢上帝给我机会撰写本书,让我分享这些知识。在这个过程中,我亲爱的妻子Bethany给予了极大的支持和鼓励。谢谢你全部的爱,亲爱的。非常感谢我的搭档William,他是我灵感和洞察力的来源。
William Tjhi :数据科学家,在学术、政府及工业界具有多年的工作经验。他自读博期间开始了数据科学之旅,研究了一些新算法以提高高维数据聚类的健壮性。取得博士学位之后,他从基础研究转向了应用研究,致力于采用机器学习方法解决分子生物学和传染病学中的各种问题。他在一些同行评审的期刊和会议上发表了部分研究成果。随着大数据的兴起,William离开了学术界,转而投入工业界,开始了商业和公共部门领域的数据科学实践。William热衷于R,从他搞研究的那天开始就一直使用R作为主要的分析工具。他曾经是Revolution Analytics的一员,那时候他做了很多使R更加适合大数据的贡献。
目录
前言
1 理解R的性能:为什么R程序有时候很慢?
计算性能的三个限制因素:CPU、RAM和磁盘I/O
R是运行时解释的
R是单线程的
R需要将全部数据加载到内存
算法设计影响时间和空间复杂度
小结
2 性能分析:衡量代码的性能
衡量总运行时间
使用system.time()衡量运行时间
使用rbenchmark重复衡量运行时间
使用microbenchmark衡量运行时间的分布
分析运行时间
使用Rprof()分析函数的性能
性能分析的结果
分析内存使用情况
使用OS工具监控内存使用情况、CPU使用情况和磁盘I/O
瓶颈的发现及解决
小结
3 加快R运行的简单方法
向量化
使用内置函数
预分配内存
使用更简单的数据结构
使用哈希表进行大型数据上的频繁查找
去CRAN寻找更快的包
小结
4 使用编译代码加快运行速度
在运行之前编译R代码
编译函数
即时编译(JIT)R代码
在R中使用编译语言
前提条件
以内联形式包含编译代码
调用外部编译代码
使用编译代码的注意事项
小结
5 使用GPU让R运行得更快
GPU上的通用计算
R和GPU
安装gputools
使用gputools实现快速统计建模
小结
6 减少内存使用的简单方法
重用对象而不多占用内存
删除不再需要的中间数据
运行时计算值而不是永久性存储值
交换活跃数据和非活跃数据
小结
7 使用有限的内存处理大型数据集
使用节约内存的数据结构
更小的数据类型
稀疏矩阵
对称矩阵
比特向量
使用内存映射文件并以块的形式处理数据
bigmemory包
ff包
小结
8 使用并行计算加倍提升性能
数据并行性 v.s.任务并行性
实现数据并行的算法
实现任务并行的算法
集群节点运行同一个任务时
集群节点运行多个不同任务时
计算机集群并行执行多个任务
共享内存并行性 v.s.分布式内存并行性
优化并行的性能
小结
9 将数据处理交给数据库系统
将数据抽取到R v.s.在数据库中处理数据
在关系型数据库中使用SQL进行数据预处理
将R表达式转化为SQL
使用dplyr
使用PivotalR
在数据库中运行统计和机器学习算法
使用列式数据库提升性能
使用数据库阵列最大化科学计算的性能
小结
10 R和大数据
理解Hadoop
在Amazon Web Services上配置Hadoop
使用Hadoop批量处理大型数据集
将数据上传到HDFS
使用RHadoop分析HDFS数据
R中的其他Hadoop包
小结
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网