当前位置: 首页 > 大数据

图解Spark 大数据快速分析实战 pdf电子书

简介图解Spark 大数据快速分析实战pdf百度网盘下载地址? 本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,Spark SQL、DataFrame、Dataset...
《图解Spark 大数据快速分析实战》pdf电子书下载
《图解Spark 大数据快速分析实战》pdf百度云
《图解Spark 大数据快速分析实战》pdf百度云
《图解Spark 大数据快速分析实战》pdf百度云
《图解Spark 大数据快速分析实战》pdf百度云

 

图解Spark 大数据快速分析实战pdf百度网盘下载地址?

本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,Spark SQL、DataFrame、Dataset的原理和实战,深入理解Spark数据源,流式计算的原理和实战,亿级数据处理平台Spark性能调优,Spark机器学习库,Spark 3.0的新特性和数据湖等。本书适合Spark开发人员和Spark运维人员阅读。

第 1章 Spark概述及入门实战 1
1.1 Spark简介 3
1.2 Spark原理及特点 7
1.3 Spark入门实战 33
第 2章 Spark的作业调度和资源分配算法 49
2.1 Spark的作业调度 49
2.2 Spark on YARN资源调度 74
2.3 RDD概念 86
2.4 RDD分区 89
2.5 RDD依赖关系 93
2.6 Stage 94
2.7 RDD持久化 95
2.8 RDD检查点 98
2.9 RDD实战 98
第3章 Spark SQL、DataFrame、Dataset原理和实战 117
3.1 Spark SQL基础概念 117
3.2 创建一个Spark SQL应用 119
3.3 Spark SQL视图操作 120
3.4 Spark Dataset操作 121
3.5 Spark DataFrame操作 122
3.6 Spark SQL操作 124
第4章 深入理解Spark数据源 132
4.1 Spark文件读写原理 132
4.2 Spark数据格式 138
4.3 Spark读写HDFS 150
4.4 Spark读写HBase 153
4.5 Spark读写MongoDB 159
4.6 Spark读写Cassandra 167
4.7 Spark读写MySQL 173
4.8 Spark读写Kafka 174
4.9 Spark读写ElasticSearch 182
第5章 Spark流式计算的原理和实战 189
5.1 Spark Streaming 189
5.2 Spark Structured Streaming 199
第6章 亿级数据处理平台Spark性能调优 228
6.1 内存调优 228
6.2 任务调优 234
6.3 数据本地性调优 242
6.4 算子调优 248
mapPartitionWithIndex()函数取代map()函数 248
Partitions()函数取代“重分区 排序”操作 250
6.5 Spark SQL调优 251
6.6 Spark Shuffle调优 252
6.7 Spark Streaming调优 253
6.8 处理Spark数据倾斜问题 255
第7章 Spark机器学习库 259
7.1 Spark机器学习概述 259
7.2 Spark机器学习常用统计方法 276
7.3 Spark分类模型 280
7.4 协同过滤 293
7.5 Spark聚类模型 295
第8章 Spark 3.0的新特性和数据湖 302
8.1 Spark 3.0新特性概述 302
8.2 Spark未来的趋势——数据湖 312
术语的中英文对照表 321

点击下载