当前位置: 首页 > 大数据

Flink SQL与DataStream:入门、进阶与实战 pdf电子书[356MB]

  • 大数据
  • 更新时间:2025-05-28 07:36:02
简介《Flink SQL与DataStream》是由羊艺超编著,这是一本从使用和定制开发双重视角,循序渐进地讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现的著作。 它面向Flink的初学者,内容沿着基础知识、实际问题...
《Flink SQL与DataStream:入门、进阶与实战》pdf电子书下载
《Flink SQL与DataStream:入门、进阶与实战》pdf百度网盘
《Flink SQL与DataStream:入门、进阶与实战》pdf百度网盘
《Flink SQL与DataStream:入门、进阶与实战》pdf百度网盘
《Flink SQL与DataStream:入门、进阶与实战》pdf百度网盘

 

这是一本从使用和定制开发双重视角,循序渐进地讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现的著作。

它面向Flink的初学者,内容沿着基础知识、实际问题和解决方案这条主线展开,不仅层层剖析了Flink学习中的重点和难点,而且还通过大量案例展示了如何快速获得工程化实践能力。

全书共11章,主要内容如下:

(1)Flink基础知识(第1、2章)

主要介绍了Flink的定位、核心特性、API分类,演示了如何搭建Flink作业的基础环境、如何创建一个Flink项目以及如何开发入门应用程序WordCount,并结合该应用程序说明了常见Flink作业的骨架结构。

(2)Flink分布式架构及核心概念(第3章)

主要内容包括Flink作业的运行时架构、部署模式、资源提供框架,以及开发 Flink作业时涉及的核心概念,对于后续学习Flink DataStream API和Flink SQL API很有帮助。

(3)Flink DataStream API(第4~6章)

讲解了Flink DataStream API的核心知识,包括执行环境、数据源、数据简单转换、数据分组与聚合、数据汇等,并讲解了Flink DataStream API中的时间语义、时间窗口、有状态计算和检查点这四大“王*牌武器”的由来与实现原理。

(4)Flink有状态流处理API(第7章)

Flink DataStream API不能优雅地解决窗口使用不灵活和分流成本高这两个问题,于是Flink提供了有状态流处理API。本章主要讲解了Flink有状态流处理API解决上述两个问题的方法。

(5)Flink Table API与SQL API(第8~11章)

Flink Table API和Flink SQL API的底层原理相同,可以相互转换,但Flink SQL API更为简单和常用。这4章分别介绍了Flink Table API、Flink SQL API 的功能,以及使用SQL实现流处理的核心技术,结合大量代码示例着重介绍了Flink SQL API的语法、函数、参数配置及性能优化方法。


作者简介:
羊艺超 资深大数据开发工程师,现就职于某头部短视频公司。拥有多年流式计算开发、优化、保障和治理经验,以及从0到1使用Flink SQL建设实时数仓的经验。对Flink大数据计算引擎有着深入的理解,在Flink的场景化应用方面有丰富的经验,能够使用Flink等技术组件解决千万级别QPS的实时数据场景下的痛点问题。开源了自己的 Flink 学习项目 https://github.com/yangyichao-mango/flink-study。对Redis、Kafka、ClickHouse等实时数仓构建过程中依赖的引擎都较为熟悉。个人微信公众号:大数据羊说。发表了数十篇关于实时数仓建设的原创文章,深受读者喜爱

目录:
第1章 初识Flink 1
第2章 Flink WordCount作业开发
第3章 Flink分布式架构及核心
第4章 Flink DataStream API 65
第5章 Flink的时间语义和
第6章 Flink状态原理及异常
第7章 Flink有状态流处理API 351
第8章 Flink Table API和
第9章 Flink SQL API语法 410
第10章 Flink SQL API函数 479
第11章 Flink SQL API参数配置及

点击下载