您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
R语言高效能实战 更多数据和更快速度
字数: 360
出版社: 人民邮电
作者: 刘艺非
商品条码: 9787115584403
版次: 1
开本: 16开
页数: 258
出版年份: 2022
印次: 1
定价:
¥79.9
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书将目标设定为“在一台笔记本电脑上使用R语言处理较大的数据集”,从单机大型数据集处理策略、提升计算性能、其他工具和技巧3个方面介绍了使用R语言处理数据时的实用方法。包括数据集占用空间、善用data.table处理数据、数据分块处理、提升硬盘资源使用效率、并行编程技术、提升机器学习性能,以及其他资源管理和提高性能的实用策略。帮助读者处理较大的数据集、挖掘R的开发潜能。 本书适合有一定R语言基础的读者阅读,也适合作为R语言实践工具书。
作者简介
刘艺非,中山大学社会学硕士,8年数据科学相关工作经历,曾在公益慈善、房地产、电信运营商等行业担任过数据分析师及数据挖掘工程师。在工作过程中对R语言、Python、SAS、STATA、SPSS等主流数据科学工具均有使用经验和心得。
目录
第 1章 简单直接的策略— 减少数据占用空间 1 1.1 保留必要的数据 1 1.1.1 保留必要的列 2 1.1.2 保留必要的行 4 1.2 设置合适的数据类型 13 1.3 本章小结 15 第 2章 简单直接的策略— 减少数据占用空间 1 1.1 保留必要的数据 1 1.1.1 保留必要的列 2 1.1.2 保留必要的行 4 1.2 设置合适的数据类型 13 1.3 本章小结 15 第3章 基于内存的“快工具”— data.table 16 2.1 数据读入操作 17 2.1.1 读入单个数据 17 2.1.2 读入多个数据 20 2.2 数据基本行列操作 23 2.3 数据合并、分组汇总操作 32 2.4 dtplyr:data.table和dplyr的结合 39 2.5 本章小结 46 第4章 逐块击破—数据分块处理 47 3.1 使用iotools库实现分块处理 47 3.2 使用readr库实现分块处理 57 3.3 本章小结 60 第4章 突破内存限制— 利用硬盘资源 61 4.1 实现R与关系型数据库管理 系统协作 61 4.2 使用bigmemory体系处理大型矩阵 66 4.3 使用ff体系处理大型数据框 73 4.3.1 ff体系基本数据操作 73 4.3.2 ff体系与关系型数据库 系统协作 81 4.4 新一代工具disk.frame 83 4.5 本章小结 93 第5章 友好的可视化工具— trelliscope 94 5.1 实现交互式大型分面可视化 94 5.2 本章小结 100 第6章 让R更快—并行编程 101 6.1 R并行编程技术概览 101 6.2 并行计算第三方库 103 6.2.1 snow库 104 6.2.2 multicore库 104 6.2.3 parallel库 105 6.2.4 future库 106 6.2.5 foreach库 107 6.3 网络数据爬取案例 108 6.3.1 利用foreach并行循环 进行爬取 109 6.3.2 利用tidyverse和future相结合 进行爬取 119 6.3.3 文本分词及整洁化处理 125 6.4 本章小结 132 第7章 提升机器学习效能— R的基础策略 134 7.1 使用foreach实现并行循环 136 7.2 使用更优化的第三方库 140 7.3 使用caret框架结合并行计算 145 7.4 本章小结 157 第8章 整洁流畅的框架— tidymodels 158 8.1 建立简单工作流 159 8.2 工作流比较 166 8.3 工作流超参数调优 169 8.4 多工作流同时调优 176 8.5 本章小结 180 第9章 灵活强大的框架—mlr3 181 9.1 数据及模型的创建 182 9.2 利用future支持mlr3计算任务 190 9.3 嵌套重抽样过程 201 9.4 以图管理机器学习工作流 204 9.5 本章小结 213 第 10章 强强联合—利用 reticulate库借力Python 214 10.1 配置Python环境 215 10.2 在R中用Python代码编程 217 10.3 以R编程方式使用Python 223 10.4 本章小结 227 第 11章 简单高效的自动机器学习 工具—H2O 228 11.1 H2O基本使用方法 229 11.2 H2O自动机器学习 242 11.3 本章小结 247 第 12章 善其事,利其器— 其他策略和工具 248 12.1 内存及硬盘资源管理类策略 248 12.1.1 读取压缩文件 248 12.1.2 以rds格式保存中间结果 250 12.1.3 垃圾回收机制 251 12.1.4 R的内存管理工具 251 12.1.5 使用pryr库 252 12.2 计算效能提升类策略 254 12.2.1 函数编译 255 12.2.2 使用benchmarkme库 256 12.3 使用R的增强发行版本 258 12.3.1 Microsoft R Open 258 12.3.2 Microsoft R Client 260 12.4 其他数据科学工具 261 12.4.1 SAS(Statistical Analysis System) 261 12.4.2 Python 262 12.5 本章小结 264
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网