当前位置: 首页 > 大数据

Hadoop实战手册pdf电子书

简介Hadoop实战手册中文版怎么样? 这是一本hadoop实用手册,主要针对实际问题给出相应的解决方案。《hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解...
《Hadoop实战手册》pdf电子书下载
《Hadoop实战手册》pdf百度云
《Hadoop实战手册》pdf百度云

 

Hadoop实战手册中文版怎么样?

这是一本hadoop实用手册,主要针对实际问题给出相应的解决方案。《hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍hadoop数据导入导出、hdfs的概述、pig与hive的使用、etl和简单的数据处理,还介绍了mapreduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍hadoop的部署的各种模式、添加新节点、退役节点、快速恢复、mapreduce调优等。

《hadoop实战手册》适合各个层次的hadoop技术人员阅读。通过阅读《hadoop实战手册》,hadoop初学者可以使用hadoop来进行数据处理,hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,hadoop系统管理员可以更好地进行日常运维。《hadoop实战手册》也可作为一本hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。


作者简介:
jonathan r. owens:软件工程师,拥有java和c++技术背景,最近主要从事hadoop及相关分布式处理技术工作。目前就职于comscore公司,为核心数据处理团队成员。comscore是一家知名的从事数字测量与分析的公司,公司使用hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 jon lentz:comscore核心数据处理团队软件工程师。他更倾向于使用pig脚本来解决问题。在加入comscore之前,他主要开发优化供应链和分配固定收益证券的软件。 brian femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于potomac fusion公司,这家公... jonathan r. owens:软件工程师,拥有java和c++技术背景,最近主要从事hadoop及相关分布式处理技术工作。目前就职于comscore公司,为核心数据处理团队成员。comscore是一家知名的从事数字测量与分析的公司,公司使用hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 jon lentz:comscore核心数据处理团队软件工程师。他更倾向于使用pig脚本来解决问题。在加入comscore之前,他主要开发优化供应链和分配固定收益证券的软件。 brian femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于potomac fusion公司,这家公司主要从事可扩展算法的开发,并致力于学习并改进政府领域中最先进和最复杂的数据集。他通过教授课程和会议培训在公司内部普及hadoop和云计算相关的技术。 傅杰,硕士,毕业于清华大学高性能所,现就职于优酷土豆集团,任数据平台架构师,负责集团大数据基础平台建设,支撑其他团队的存储与计算需求,包含hadoop基础平台、日志采集系统、实时计算平台、消息系统、天机镜系统等。个人专注于大数据基础平台架构及安全研究,积累了丰富的平台运营经验,擅长hadoop平台性能调优、jvm调优及诊断各种mapreduce作业,还担任china hadoop submit 2013大会专家委员、优酷土豆大数据系列课程策划&讲师、easyhadoop社区讲师。 赵磊,硕士,毕业于中国科学技术大学,现就职于优酷土豆集团,任数据挖掘算法工程师,负责集团个性化推荐和无线消息推送系统的搭建和相关算法的研究。个人专注于基于大数据的推荐算法的研究与应用,积累了丰富的大数据分析与数据挖掘的实践经验,对分布式计算和海量数据处理有深刻的认识。 卢学裕,硕士,毕业于武汉大学,曾供职腾讯公司即通部门,现就职于优酷土豆集团,担任大数据技术负责人,负责优酷土豆集团大数据系统平台、大数据分析、数据挖掘和推荐系统。有丰富的hadoop平台使用及优化经验,尤其擅长mapreduce的性能优化。基于hadoop生态系统构建了优酷土豆的推荐系统,bi分析平台。

目录:
第1章 hadoop分布式文件系统——导入和导出数据 1
第2章 hdfs 28
第3章 抽取和转换数据 51
第4章 使用hive、pig和mapreduce处理常见的任务 85
第5章 高级连接操作 104
第6章 大数据分析 123
第7章 高级大数据分析 147
第8章 调试 174
第9章 系统管理 189
第10章 使用apache accumulo进行持久化 204

点击下载