-
Python和HDF5大数据应用PDF电子书 [6MB]
Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书会带你迅速了解使用HDF5对大小...
发布日期:2021-03-21
FlinK基础教程PDF电子书 [7MB]
FlinK基础教程中文版怎么样? 作为新一代的开源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。作者介绍 埃伦·弗里德曼。...
发布日期:2021-03-21
Spark MLlib机器学习实践第2版PDF电子书 [12MB]
Spark作为新兴的、应用范围为广泛的大数据处理开源框架引起了广泛的关注,它吸引了大量程序设计和开发人员进行相关内容的学习与开发,其中MLlib是Spark框架使用的核心。本书是一本细致介绍Spark MLlib程序设计的图书,入门简单,示例丰富。本书分为13章,从Spark基础安装和配置开始,依次介绍MLlib...
发布日期:2021-03-21
Spark:大数据集群计算的生产实践PDF电子书 [86MB]
《Spark:大数据集群计算的生产实践》pdf简介:《Spark:大数据集群计算的生产实践》涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章,第1 ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Sp...
发布日期:2021-03-21
Kafka权威指南PDF电子书 [115MB]
《Kafka权威指南》pdf简介:每个应用程序都会产生数据,包括日志消息、度量指标、用户活动记录、响应消息等。如何移动数据,几乎变得与数据本身一样重要。如果你是架构师、开发者或者产品工程师,同时也是Apache Kafka新手,那么这本实践指南将会帮助你成为流式平台上处理实时数据的专家。《Kafka权威指南》p...
发布日期:2021-03-21
SCALA编程思想 原书第2版PDF电子书 [54MB]
《SCALA编程思想 原书第2版》pdf简介:《Scala编程思想(原书第2版)》介绍了Scala的基础特性,采用短小精悍的“原子”解构Scala语言的元素和方法。一个“原子”即为一个小型知识点,通过代码示例引导读者逐步领悟Scala的要义,结合练习鼓励读者在实...
发布日期:2021-03-21
数据算法 Hadoop Spark大数据处理技巧PDF电子书 [77MB]
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。主要内容包括:完成超大量交易的购物篮分析。数据挖掘算法(K-均值、KNN...
发布日期:2021-03-21
自己动手做大数据系统PDF电子书 [16MB]
自己动手做大数据系统中文版怎么样? 如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面自己动手做大数据系统中文版怎么样? 如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自...
![人人都是数据分析师:Tableau应用实战PDF电子书 [21MB]](/d/file/bigdata/f23daf916f0ecf60fd9f73d4fc6c21af1.jpg)
![颠覆大数据分析 基于StormSpark等Hadoop替代技术的实时应用PDF电子书 [19MB]](/d/file/bigdata/4d24cf9ee45fc8be78809dba7a0ed3431.jpg)