Flink大数据分析实战--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥22.05

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

内容简介

\\\"本书由资深大数据专家精心编写，循序渐进地介绍了Flink生态系统主流的大数据开发技术。全书共7章，第1章讲解Flink的基础知识，包括Flink应用场景、主要组件、编程模型等，最后通过一个单词计数示例带领读者快速体验Flink应用程序的编写；第2、3章讲解Flink的多种运行时架构、任务调度原理、数据分区以及Flink集群的安装部署，同时包括Flink命令行操作、应用程序提交、常用Shell命令等；第4～7章讲解了Flink流式计算DataStream API、关系型计算Table&SQL API以及图计算框架Gelly等的基础知识、架构原理，同时包括常用Shell命令、API操作、内核源码剖析，并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、Kafka的整合操作。本书内容翔实，实例丰富，适合Flink新手、大数据开发人员阅读，也可作为培训机构和大专院校相关专业的教学用书。 \\\"

作者简介

张伟洋,大数据领域资深专家，拥有多年互联网公司软件研发经验，曾在互联网旅游公司任软件研发事业部经理。先后多次为中国海洋大学、曲阜师范大学、青岛理工大学等高校举行大数据专题讲座，对Hadoop及周边大数据框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究。已出版《Hadoop大数据技术开发实战》《Spark大数据分析实战》等图书，公众号 “奋斗在IT” 的创办人。

第1章初识Flink 1 1.1 大数据开发总体架构 1 1.2 什么是Flink 3 1.3 Flink的应用场景 5 1.4 流计算框架对比 6 1.5 Flink的主要组件 8 1.6 Flink编程模型 9 1.6.1 数据集 9 1.6.2 编程接口 11 1.6.3 程序结构 12 1.7 快速体验Flink程序 13 1.7.1 IntelliJ IDEA安装Scala插件 13 1.7.2 IntelliJ IDEA创建Flink项目 15 1.7.3 示例：批处理单词计数 17 1.7.4 示例：流处理单词计数 20 第2章 Flink运行架构及原理 23 2.1 Flink运行时架构 23 2.1.1 YARN集群架构 23 2.1.2 Flink Standalone架构 27 2.1.3 Flink On YARN的架构 29 2.2 Flink任务调度原理 30 2.2.1 任务链 30 2.2.2 并行度 31 2.2.3 共享Task Slot 32 2.2.4 数据流 33 2.2.5 执行图 34 2.2.6 执行计划 35 2.3 Flink数据分区 38 2.3.1 分区数量 38 2.3.2 分区策略 39 第3章 Flink安装及部署 41 3.1 Flink集群搭建 41 3.1.1 Flink本地模式搭建 42 3.1.2 Flink Standalone搭建 44 3.1.3 Flink On YARN搭建 46 3.2 Flink HA模式 54 3.2.1 Flink Standalone模式的HA 架构 55 3.2.2 Flink Standalone模式HA集群搭建 56 3.2.3 Flink On YARN模式HA集群搭建 60 3.3 Flink命令行界面 61 3.4 Flink应用提交 65 3.5 Flink Shell的使用 67 第4章 Flink DataStream API 72 4.1 基本概念 72 4.2 执行模式 73 4.3 作业流程 76 4.4 程序结构 77 4.5 Source数据源 79 4.5.1 基本数据源 79 4.5.2 高级数据源 81 4.5.3 自定义数据源 81 4.6 Transformation数据转换 85 4.7 Sink数据输出 97 4.8 数据类型与序列化 98 4.9 分区策略 100 4.9.1 内置分区策略 101 4.9.2 自定义分区策略 114 4.10 窗口计算 117 4.10.1 事件时间 117 4.10.2 窗口分类 118 4.10.3 窗口函数 124 4.10.4 触发器 133 4.10.5 清除器 134 4.11 水印 137 4.11.1 计算规则 138 4.11.2 允许延迟与侧道输出 140 4.11.3 生成策略 142 4.12 状态管理 147 4.12.1 Keyed State 149 4.12.2 Operator State 152 4.13 容错机制 156 4.13.1 Checkpoint 156 4.13.2 Barrier 162 4.13.3 重启与故障恢复策略 165 4.13.4 Savepoint 167 4.14 案例分析：计算5秒内输入的单词数量 168 4.15 案例分析：统计5分钟内每个用户产生的日志数量 170 4.16 案例分析：统计24小时内每个用户的订单平均消费额 173 4.17 案例分析：计算5秒内每个信号灯通过的汽车数量 177 4.18 案例分析：Flink整合Kafka计算实时单词数量 183 4.19 案例分析：天猫双十一实时交易额统计 188 4.19.1 创建自定义数据源 188 4.19.2 计算各个分类的订单总额 189 4.19.3 计算全网销售总额与分类Top3 192 第5章 Flink Table API&SQL 196 5.1 基本概念 196 5.1.1 计划器 197 5.1.2 API架构 197 5.1.3 程序结构 199 5.2 动态表 200 5.2.1 流映射为动态表 201 5.2.2 连续查询 201 5.2.3 动态表转换为流 203 5.3 TableEnvironment API 205 5.3.1 基本概念 205 5.3.2 创建TableEnvironment 205 5.3.3 示例：简单订单统计 206 5.4 Table API 210 5.4.1 基本概念 210 5.4.2 示例：订单分组计数 211 5.4.3 示例：每小时订单分组求平均值 213 5.4.4 关系操作 214 5.5 SQL API 217 5.5.1 DDL操作 218 5.5.2 DML操作 221 5.5.3 DQL操作 222 5.5.4 窗口函数 223 5.5.5 窗口聚合 230 5.5.6 分组聚合 233 5.5.7 OVER聚合 235 5.5.8 连接查询 237 5.6 TopN查询 240 5.6.1 OVER子句 240 5.6.2 示例：计算产品类别销售额TopN 242 5.6.3 示例：搜索词热度统计 243 5.6.4 窗口TopN 246 5.7 Catalog元数据管理 248 5.8 Flink SQL整合Kafka 250 5.8.1 基本概念 250 5.8.2 示例：Flink SQL整合Kafka实现实时ETL 253 5.9 Flink SQL CLI 258 5.9.1 启动SQL CLI 259 5.9.2 执行SQL查询 260 5.9.3 可视化结果模式 262 5.10 Flink SQL整合Hive 263 5.10.1 整合步骤 264 5.10.2 Table API操作Hive 272 5.10.3 示例：Flink SQL整合Hive分析搜狗用户搜索日志 274 5.11 案例分析：Flink SQL实时单词计数 279 5.12 案例分析：Flink SQL实时计算 5秒内用户订单总金额 283 5.13 案例分析：微博用户行为分析 288 5.13.1 离线与实时计算业务架构 288 5.13.2 Flume数据采集架构 291 5.13.3 Kafka消息队列架构 293 5.14 案例分析：Flink SQL智慧交通数据分析 294 5.14.1 项目介绍 294 5.14.2 数据准备 295 5.14.3 统计正常卡口数量 297 5.14.4 统计车流量排名前3的卡口号 299 5.14.5 统计每个卡口通过速度最快的前3辆车 300 5.14.6 车辆轨迹分析 302 第6章 Flink内核源码 304 6.1 流图 304 6.1.1 StreamGraph核心对象 305 6.1.2 StreamGraph生成过程 308 6.2 作业图 310 6.2.1 JobGraph的核心对象 312 6.2.2 JobGraph的生成过程 312 6.3 执行图 319 6.3.1 ExecutionGraph的核心对象 319 6.3.2 ExecutionGraph的生成过程 320 第7章 Gelly图计算 324 7.1 什么是Gelly 324 7.2 第一个Gelly程序 325 7.3 Gelly数据结构 328 7.4 如何使用Gelly 329 7.5 图操作 330 7.5.1 基本操作 330 7.5.2 属性操作 332 7.5.3 结构操作 335 7.5.4 连接操作 335 7.6 图常用API 337 7.6.1 创建图 337 7.6.2 图的转换 339 7.6.3 图的添加与移除 342 7.6.4 图的邻域方法 343 7.7 案例分析：Gelly计算社交网络中粉丝的平均年龄 346

Flink大数据分析实战

库存： {{selectedSku?.stock}} 库存充足