您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Spark大数据商业实战三部曲 内核解密 商业案例 性能调优(第2版)
字数: 2120000
装帧: 精装
出版社: 清华大学出版社
作者: 王家林,段智华
出版日期: 2020-06-01
商品条码: 9787302544531
版次: 2
开本: 16开
页数: 1303
出版年份: 2020
定价:
¥329
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
基于近期新的Spark2.4.X版本,分为内核解密篇,商业案例篇,性能调优篇和Spark+AI解密篇,共32章,学习过程中有任何疑问,可加入QQ群418110145,有专业人员答疑解惑。
内容简介
本书基于Spark2.4.X版本,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分4篇,内核解密篇基于Spark源码,从一个实战案例入手,循序渐进地全面解析Spark2.4.X版本的新特性及Spark内核源码;商业案例篇选取Spark开发中拥有代表性的经典学习案例,在案例中综合介绍Spark的大数据技术;性能调优篇覆盖Spark在生产环境下的所有调优技术;Spark+AI解密篇讲解深度学习实践、Spark+PyTorch案例实战、Spark+TensorFlow实战以及Spark上的深度学习内核解密。本书适合所有Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员,本书也可作为Spark高手修炼的参考用书。本书还适合作为高等院校的大数据课程教材。
目录
第1篇内核解密篇
第1章电光石火间体验Spark2.4开发实战
1.1通过RDD实战电影点评系统入门及源码阅读
1.1.1Spark核心概念图解
1.1.2通过RDD实战电影点评系统案例
1.2通过DataFrame和DataSet实战电影点评系统
1.2.1通过DataFrame实战电影点评系统案例
1.2.2通过DataSet实战电影点评系统案例
1.3Spark2.4源码阅读环境搭建及源码阅读体验
第2章Spark2.4技术及原理
2.1Spark2.4综述
2.1.1连续应用程序
2.1.2新的API
2.2Spark2.4Core
2.2.1第二代Tungsten引擎
2.2.2SparkSession
2.2.3累加器API
2.3Spark2.4SQL
2.3.1SparkSQL
2.3.2DataFrame和DatasetAPI
2.3.3TimedWindow
2.4Spark2.4Streaming
2.4.1StructuredStreaming
2.4.2增量输出模式
2.5Spark2.4MLlib
2.5.1基于DataFrame的MachineLearningAPI
2.5.2R的分布式算法
2.6Spark2.4GraphX
第3章Spark的灵魂:RDD和DataSet
3.1为什么说RDD和DataSet是Spark的灵魂
3.1.1RDD的定义及五大特性剖析
3.1.2DataSet的定义及内部机制剖析
3.2RDD弹性特性7个方面解析
3.3RDD依赖关系
3.3.1窄依赖解析
3.3.2宽依赖解析
3.4解析Spark中的DAG逻辑视图
3.4.1DAG生成的机制
3.4.2DAG逻辑视图解析
3.5RDD内部的计算机制
3.5.1Task解析
3.5.2计算过程深度解析
3.6SparkRDD容错原理及其四大核心要点解析
3.6.1SparkRDD容错原理
3.6.2RDD容错的四大核心要点
3.7SparkRDD中Runtime流程解析
3.7.1Runtime架构图
3.7.2生命周期
3.8通过WordCount实战解析SparkRDD内部机制
3.8.1SparkWordCount动手实践
3.8.2解析RDD生成的内部机制
3.9基于DataSet的代码如何转化为RDD
第4章SparkDriver启动内幕剖析
4.1SparkDriverProgram剖析
4.1.1SparkDriverProgram
4.1.2SparkContext深度剖析
4.1.3SparkContext源码解析
4.2DAGScheduler解析
4.2.1DAG的定义
4.2.2DAG的实例化
4.2.3DAGScheduler划分Stage的原理
4.2.4DAGScheduler划分Stage的具体算法
4.2.5Stage内部Task获取很好位置的算法
4.3TaskScheduler解析
4.3.1TaskScheduler原理剖析
4.3.2TaskScheduler源码解析
4.4SchedulerBackend解析
4.4.1SchedulerBackend原理剖析
4.4.2SchedulerBackend源码解析
4.4.3Spark程序的注册机制
……
第2篇商业案例篇
第3篇性能调优篇
第4篇Spark+AI解密篇
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网