当前位置: 首页 > 其它

《大数据技术体系详解:原理、架构与实践》pdf电子书百度网盘下载地址

简介 内容简介:
董西成,资深大数据技术实践者和研究者,对大数据基础架构有非常深刻的认识和理解,有着丰富的实践经验。熟悉常见的开源大数据解决方案,包括Hadoop和spark生态系统...
《大数据技术体系详解:原理、架构与实践》pdf电子书百度网盘下载
《大数据技术体系详解:原理、架构与实践》pdf电子书百度网盘下载

 
内容简介:
 

董西成,资深大数据技术实践者和研究者,对大数据基础架构有非常深刻的认识和理解,有着丰富的实践经验。熟悉常见的开源大数据解决方案,包括Hadoop和spark生态系统等,擅长底层分布式系统的优化和开发。撰写了大量Hadoop和spark等大数据相关的技术文章并分享在自己的博客上,由于文章技术含量高,所以非常受欢迎。出版有大数据领域负有盛名的专著:《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》。


目录:

第一部分 概述篇
第1章 企业级大数据技术体系概述 2
第二部分 数据收集篇
第2章 关系型数据的收集 20
第3章 非关系型数据的收集 36
第4章 分布式消息队列Kafka 51
第三部分 数据存储篇
第5章 数据序列化与文件存储格式 70
第6章 分布式文件系统 90
第7章 分布式结构化存储系统 104
第四部分 分布式协调与资源管理篇
第8章 分布式协调服务ZooKeeper 130
第9章 资源管理与调度系统YARN 146
第五部分 大数据计算引擎篇
第10章 批处理引擎MapReduce 176
第11章 DAG计算引擎Spark 215
第12章 交互式计算引擎 261
第13章 流式实时计算引擎 276
第六部分 数据分析篇
第14章 数据分析语言HQL与SQL 308
第15章 大数据统一编程模型 325
第16章 大数据机器学习库 351
 

点击下载