当前位置: 首页 > 大数据

Hadoop生态系统pdf电子书

简介Hadoop生态系统中文版怎么样? 《Hadoop生态系统》本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说...
《Hadoop生态系统》pdf电子书百度网盘下载
《Hadoop生态系统》pdf电子书百度网盘下载


 

Hadoop生态系统中文版怎么样?最新电子版百度云下载

《Hadoop生态系统》本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。

主要包括如下主题:核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。数据库和数据管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计,Sentry、Kerberos和Knox。云计算和虚拟化,Serengeti、Docker和Whirr。


作者简介:
Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。 Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。

目录:
第1章关键技术
第2章数据库及数据管理
第3章序列化
第4章管理与监控
第5章分析辅助
第6章数据传输
第7章安全、访问控制和审计
第8章云计算和虚拟化

点击下载