当前位置: 首页 > 其它

《Hadoop数据分析》pdf电子书百度网盘下载地址

简介 内容简介:
通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析...
《Hadoop数据分析》pdf电子书百度网盘下载
《Hadoop数据分析》pdf电子书百度网盘下载

 
内容简介:
 

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。


目录:

第1章 数据产品时代  2
第2章 大数据操作系统  9
第3章 Python 框架和Hadoop Streaming  31
第4章 Spark内存计算  52
第5章 分布式分析和模式  69
第6章 数据挖掘和数据仓  102
第7章 数据采集  123
第8章 使用高级API 进行分析  137
第9章 机器学习  154
第10章 总结:分布式数据科学实战  167
 

点击下载