-
Hadoop权威指南PDF电子书 [185MB]
《Hadoop权威指南》pdf简介:本书结合理论和实践,由浅入深,全方位介绍了Hadoop 这一高性能的海量数据处理和分析平台。全书5部分24 章,第Ⅰ部分介绍Hadoop 基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop 的运维,第Ⅳ部分介绍Hadoop 相关开源项目,第Ⅴ部分提供了三个案...
发布日期:2020-09-27
大数据架构商业之路PDF电子书 [62MB]
《大数据架构商业之路》pdf简介:目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟...
发布日期:2020-09-20
Hadoop数据分析PDF电子书 [10MB]
《Hadoop数据分析》pdf简介:通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一...
发布日期:2020-09-20
大数据架构师指南PDF电子书 [133MB]
大数据架构师指南pdf怎么样?本书的目的就是为了帮助读者在最短的时间内,系统地把握大数据相关的技术框架,建立系统架构级别的技术思考能力与原则。本书适用于企业的IT与大数据的从业人员,IT与大数据相关的销售人员,企业的首席技术官(CTO)、首席信息官(CIO),由于本书在大数据知识具备系统性,也可以作为高校大数据...
发布日期:2020-09-20
大数据技术体系详解:原理、架构与实践PDF电子书 [96MB]
《大数据技术体系详解:原理、架构与实践》pdf简介:董西成,资深大数据技术实践者和研究者,对大数据基础架构有非常深刻的认识和理解,有着丰富的实践经验。熟悉常见的开源大数据解决方案,包括Hadoop和spark生态系统等,擅长底层分布式系统的优化和开发。撰写了大量Hadoop和spark等大数据相关的技术文章并...
发布日期:2020-09-20
Hadoop Spark生态系统操作与实战指南PDF电子书 [108MB]
本书用于Hadoop+Spark快速上手,全面解析Hadoop和Spark生态系统,通过原理解说实例操作每一个组件,让读者能够跨入大数据分析与开发的大门。全书共12章,分为三部分:第一部分讲解Hadoop生态组件,包括Hadoop集群搭建及MapReduce、HDFS、YARN等原理,并涵盖ZooKeeper...
发布日期:2020-09-20
Spark快速大数据分析PDF电子书 [8MB]
大数据是近几年广受关注的一个概念。今天,互联网不断发展,逐渐深入我们生活的各个层面,随之而来的是数据量的指数级增长。很久以前,人类就学会了通过分析数据获取有价值的结论。影响结论的因素过多,采样的数据无法有效保留所有因素的影响,得出的结论就不够有效。如果不使用采样,而原始数据规模巨大,我们就需要改进数据处理的手段...
![Spark大数据处理:技术、应用与性能优化PDF电子书 [45MB]](/d/file/other/8cff2f1c5a08bd824d18324812f18d880.jpg)
![Spark高级数据分析PDF电子书 [9MB]](/d/file/other/012c83cc9ca651eed344bb90c6a32bae.jpg)