您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Spark实时大数据分析 基于Spark Streaming框架
字数: 338千字
装帧: 平装
出版社: 清华大学出版社
作者: (美)祖贝尔·纳比(Zubair Nabi) 著 王胜夏,景玉 译
出版日期: 2018-11-01
商品条码: 9787302511878
版次: 1
开本: B5
页数: 241
出版年份: 2018
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书详细阐述了与Spark实时大数据分析以及Spark Streaming框架相关的基本解决方案,主要包括大数据漫游指南,实时RDD,高速流:链接外部数据源,边界效应,实时ETL和分析技术,大规模机器学习,云、Lambda及Python等内容。此外,本书还提供了丰富的示例以及代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
作者简介
目录
章 大数据漫游指南
1.1 Spark前传
1.1.1Web 2.0时代
1.1.2 无处不在的传感器
1.2 Spark Streaming:MapReduce和CEP的交集
第2章 Spark简介
2.1 安装
2.2 执行
2.2.1 独立集群模式(Standalone Cluster)
2.2.2 YARN模式
2.3 第一个应用程序
2.3.1 构建
2.3.2 执行
2.4 SparkContext
2.4.1 RDDs创建
2.4.2 处理依赖关系
2.4.3 创建共享变量
2.4.4 作业执行
2.5 RDD
2.5.1 持久化
2.5.2 转换
2.5.3 行动(Action)
小结
第3章 实时RDD:DStream
3.1 从连续流到离散流
3.2 第一个Spark Streaming应用程序
3.2.1 构建和执行
3.2.2 Streaming Context
3.3 DStreams
3.3.1 Spark Streaming应用程序剖析
3.3.2 转换
小结
第4章 高速流:并行化及其他
4.1 流数据的一大飞跃
4.2 并行化
4.2.1 Worker
4.2.2 执行器(Executor)
4.2.3 任务(Task)
4.3 批处理间隔
4.4 调度
4.4.1 应用程序间调度
4.4.2 批处理调度
4.4.3 作业间调度
4.4.4 一个行动,一个作业
4.5 内存
4.5.1 序列化
4.5.2 压缩(Compression)
4.5.3 垃圾收集
4.6 Shuffle
4.6.1 早期投影和过滤
4.6.2 经常使用组合器
4.6.3 大量运用平行化
4.6.4 文件合并(File Consolidation)
4.6.5 更多内存
小结
第5章 链接外部数据源
5.1 智慧城市,智慧地球,一切更智慧
5.2 ReceiverInputDStream
5.3 套接字
5.4 MQTT
5.5 Flume
5.5.1 基于推模式的Flume数据摄取
5.5.2 基于拉模式的Flume数据摄取
5.6 Kafka
5.6.1 基于接收器的Kafka消费者
5.6.2 直接Kafka消费者
5.7 Twitter
5.8 块间隔
5.9 自定义接收器
小结
第6章 边界效应
6.1 盘点股市
6.2 foreachRDD
6.2.1 为每条记录创建一个连接
6.2.2 为每个分区创建一个连接
6.2.3 静态连接
6.2.4 惰性静态连接
6.2.5 静态连接池
6.3 可扩展流存储
6.3.1 HBase
6.3.2 股市控制台(Dashboard)
6.3.3 SparkOnHBase
6.3.4 Cassandra
6.3.5 Spark Cassandra连接器
6.4 全局状态(Global State)
6.4.1 静态变量
6.4.2 updateStateByKey()
6.4.3 累加器
6.4.4 外部解决方案
小结
第7章 充分准备
7.1 每个点击都异乎重要
7.2 Tachyon(Alluxio)
7.3 Spark Web UI
7.3.1 历史分析
7.3.2 RESTful度量
7.4 日志记录
7.5 外部度量
7.6 系统度量
7.7 监控和报警
小结
第8章 实时ETL和分析技术
8.1 交易数据记录的强大功能
8.2 第一个流式Spark SQL应用程序
8.3 SQLContext
8.3.1 创建数据框
8.3.2 执行SQL
8.3.3 配置
8.3.4 用户自定义函数
8.3.5 Catalyst:查询执行和优化
8.3.6 HiveContext
8.4 数据框(Data Frame)
8.4.1 类型
8.4.2 查询转换
8.4.3 行动
8.4.4 RDD操作
8.4.5 持久化
8.4.6 最佳做法
8.5 SparkR
8.6 第一个SparkR应用程序
8.6.1 执行
8.6.2 流式SparkR
小结
第9章 大规模机器学习
9.1 传感器数据风暴
9.2 流式MLlib应用程序
9.3 MLlib
9.3.1 数据类型
9.3.2 统计分析
9.3.3 预处理
9.4 特征选择和提取
9.4.1 卡方选择
9.4.2 主成分分析
9.5 学习算法
9.5.1 分类
9.5.2 聚类
9.5.3 推荐系统
9.5.4 频繁模式挖掘
9.6 流式ML管道应用程序
9.7 ML
9.8 管道交叉验证
小结
0章 云、Lambda及Python
10.1 一条好评胜过一千个广告
10.2 Google Dataproc
10.3 基于Dataproc应用程序创建的第一个Spark
10.4 PySpark
10.5 Lambda架构
10.6 流式图分析
总结
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网