您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Flink SQL与DataStream 入门、进阶与实战
字数: 707000
装帧: 平装
出版社: 机械工业出版社
作者: 羊艺超
出版日期: 2024-01-01
商品条码: 9787111739029
版次: 1
开本: 32开
页数: 1016
出版年份: 2024
定价:
¥129
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
(1)作者背景资深:某头部短视频平台Flink专家,拥有多年流式计算开发、优化、保障和治理经验,对Flink大数据计算引擎有着深入的理解。 (2)作者经验丰富:有从0到1使用Flink SQL建设实时数仓的经验,在Flink场景化应用方面有丰富的经验,能够使用Flink等技术组件解决千万级别QPS的实时数据场景下的痛点问题。 (3)双重视角展开:从Flink使用和定制开发双重视角,循序渐进讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现。 (4)理论深入详细:除了Flink的架构设计和核心技术的原理外,本书还详细讲解了SQL API、Table API、DataStream API 和有状态流处理 API四大API的细节。 (5)注重工程实战:用大量案例和图表详解用Java和Flink SQL开发Flink流处理作业的方法和过程,掌握工程化实践能力。
内容简介
这是一本从使用和定制开发双重视角,循序渐进地讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现的著作。 它面向Flink的初学者,内容沿着基础知识、实际问题和解决方案这条主线展开,不仅层层剖析了Flink学习中的重点和难点,而且还通过大量案例展示了如何快速获得工程化实践能力。 全书共11章,主要内容如下: (1)Flink基础知识(第1、2章) 主要介绍了Flink的定位、核心特性、API分类,演示了如何搭建Flink作业的基础环境、如何创建一个Flink项目以及如何开发入门应用程序WordCount,并结合该应用程序说明了常见Flink作业的骨架结构。 (2)Flink分布式架构及核心概念(第3章) 主要内容包括Flink作业的运行时架构、部署模式、资源提供框架,以及开发 Flink作业时涉及的核心概念,对于后续学习Flink DataStream API和Flink SQL API很有帮助。 (3)Flink DataStream API(第4~6章) 讲解了Flink DataStream API的核心知识,包括执行环境、数据源、数据简单转换、数据分组与聚合、数据汇等,并讲解了Flink DataStream API中的时间语义、时间窗口、有状态计算和检查点这四大“王*牌武器”的由来与实现原理。 (4)Flink有状态流处理API(第7章) Flink DataStream API不能优雅地解决窗口使用不灵活和分流成本高这两个问题,于是Flink提供了有状态流处理API。本章主要讲解了Flink有状态流处理API解决上述两个问题的方法。 (5)Flink Table API与SQL API(第8~11章) Flink Table API和Flink SQL API的底层原理相同,可以相互转换,但Flink SQL API更为简单和常用。这4章分别介绍了Flink Table API、Flink SQL API 的功能,以及使用SQL实现流处理的核心技术,结合大量代码示例着重介绍了Flink SQL API的语法、函数、参数配置及性能优化方法。
目录
前言
第1章 初识Flink 1
1.1 Flink定位 1
1.1.1 Flink是什么 2
1.1.2 Flink对于数据的定义 3
1.1.3 Flink的3种应用场景 4
1.1.4 Flink的3个企业应用案例 7
1.2 Flink的核心特性 9
1.2.1 Flink的5个核心特性 9
1.2.2 3种流处理引擎特性的对比 10
1.3 Flink的API 11
1.3.1 Code API 11
1.3.2 关系型API 13
1.4 与Flink搭配使用的引擎 15
1.5 本章小结 16
第2章Flink WordCount作业开发及运行 17
2.1 基础环境准备 17
2.2 创建一个Flink项目 18
2.3 Flink WordCount代码案例 21
2.4 Flink作业的骨架结构 24
2.5 本章小结 25
第3章Flink分布式架构及核心概念 26
3.1分布式应用与非分布式应用的异同 27
3.2 Flink作业的运行时架构 28
3.2.1 Flink作业提交部署流程 28
3.2.2 Client 30
3.2.3 JobManager 30
3.2.4 TaskManager 31
3.3 Flink作业的3种部署模式 31
3.3.1 Session模式 32
3.3.2 Per-Job模式 33
3.3.3 Application模式 35
3.4 Flink作业的2种资源提供框架 36
3.4.1 Standalone 36
3.4.2 YARN 40
3.5开发Flink作业时涉及的核心概念 42
3.5.1 Function 44
3.5.2 Operator 44
3.5.3 算子并行度 46
3.5.4 Operator Chain 49
3.5.5 Task和SubTask 52
3.5.6 Task Slot和共享Task Slot 53
3.5.7 算子优选并行度 54
3.6 Flink Web UI 56
3.6.1 概览模块 57
3.6.2 Flink作业详情 58
3.7 本章小结 64
第4章 Flink DataStream API 65
4.1 什么是DataStream 65
4.2 执行环境 66
4.3 数据源 67
4.3.1从数据源存储引擎中读取数据的API 67
4.3.2 从Socket中读取数据 69
4.3.3 从Kafka中读取数据 69
4.3.4 从自定义数据源中读取数据 74
4.4 数据简单转换 76
4.4.1 单流的3种数据简单转换 76
4.4.2 多流的4种数据简单转换 80
4.5 数据分组与聚合 84
4.5.1 KeyBy 85
4.5.2 Max、Min和Sum 88
4.5.3 Reduce 92
4.6 数据汇 95
4.6.1向数据汇存储引擎写数据的API 95
4.6.2 向控制台输出数据 95
4.6.3 向Kafka写入数据 96
4.6.4 向自定义数据汇写入数据 99
4.7 算子间数据传输的8种策略 100
4.7.1 Forward 100
4.7.2 Rebalance 103
4.7.3 Shuff?le 106
4.7.4 KeyGroup 106
4.7.5 Rescale 107
4.7.6 Broadcast 108
4.7.7 Global 110
4.7.8 Custom Partition 110
4.8 数据异步I/O处理 112
4.8.1同步I/O处理导致作业低吞吐 112
4.8.2同步I/O处理低吞吐的4种解决方案 113
4.8.3 异步I/O处理原理 113
4.8.4 异步I/O处理API 114
4.8.5异步I/O处理API的注意事项 117
4.9 RichFunction 118
4.10 数据序列化 121
4.10.1Flink数据序列化机制的诞生过程 122
4.10.2Flink支持的7种数据类型 123
4.10.3TypeInformation与TypeSerializer 125
4.10.4Java Lambda表达式对数据序列化的影响 127
4.10.5 使用注意事项 129
4.11 工具类及Debug建议 131
4.11.1 ParameterTool 131
4.11.2 Debug建议 132
4.12 本章小结 132
第5章Flink的时间语义和时间窗口 134
5.1 时间语义和时间窗口概述 134
5.2 时间窗口 137
5.2.1 Flink中的时间窗口 138
5.2.2 为什么需要时间窗口 139
5.2.3时间窗口程序的骨架结构 141
5.2.4 时间窗口的计算机制 143
5.2.5 窗口分配器 145
5.2.6 窗口处理函数 154
5.2.7 窗口触发器 169
5.3 时间语义 176
5.3.1 处理时间 177
5.3.2 事件时间 178
5.3.3 摄入时间 180
5.4 Watermark 180
5.4.1 Watermark的诞生背景 180
5.4.2 Watermark的定义及特点 185
5.4.3 Watermark的传输策略 187
5.4.4使用Watermark缓解数据乱序问题 193
5.4.5 生成Watermark的API 196
5.5 双流数据时间窗口关联 204
5.5.1 时间窗口关联 205
5.5.2 时间窗口CoGroup操作 208
5.5.3 时间区间关联 210
5.6 计数窗口 213
5.7生产中的常见问题及解决方案 215
5.7.1事件时间窗口不触发计算的3种原因及解决方案 216
5.7.2事件时间窗口数据乱序问题的体系化解决方案 223
5.7.3windowAll()方法导致数据倾斜问题的解决方案 230
5.7.4扩展思考?:Watermark是否只能从时间戳中取值 233
5.8 本章小结 233
第6章Flink状态原理及异常容错机制 235
6.1 Flink有状态计算 235
6.1.1 状态及有状态计算的定义 235
6.1.2Flink有状态计算的4类应用 237
6.1.3传统有状态计算方案应用于大数据场景时存在的3个问题 237
6.1.4Flink实现有状态计算的思路 240
6.1.5Flink实现有状态计算面临的2个难题 248
6.1.6 Flink有状态计算总结 251
6.2 Flink状态接口 252
6.2.1 Flink状态的分类 252
6.2.2 算子状态 257
6.2.3 键值状态 269
6.2.4 广播状态 286
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网