Hadoop Spark生态系统操作与实战指南PDF电子书 [108MB]
- 大数据
- 更新时间:2020-09-20 21:03:01
简介本书用于Hadoop+Spark快速上手,全面解析Hadoop和Spark生态系统,通过原理解说实例操作每一个组件,让读者能够跨入大数据分析与开发的大门。全书共12章,分为三部分:第一部分讲解Hadoop生态组件,包括Hadoop集群搭建及MapReduce、HDFS、YARN等原理,并涵盖ZooKeeper...

本书用于Hadoop+Spark快速上手,全面解析Hadoop和Spark生态系统,通过原理解说和实例操作每一个组件,让读者能够轻松跨入大数据分析与开发的大门。
全书共12章,分为三部分:第一部分讲解Hadoop生态组件,包括Hadoop集群搭建及MapReduce、HDFS、YARN等原理,并涵盖ZooKeeper、HBase、Hive的实战操作;第二部分解析Spark生态系统,涉及Spark Core、Spark SQL、Spark Streaming等技术原理,结合Scala语言及Flume、Kafka组件进行开发实践;第三部分通过网站日志离线分析和实时处理项目整合Hadoop与Spark组件,演示完整数据处理流程。书中采用原理与实例结合方式,提供Java和Scala代码示例及开发环境配置指南。