当前位置: 首页 > 其它

《Spark高级数据分析》pdf电子书百度网盘下载

简介本书是使用Spark进行大规模数据分析的实战宝典,由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Sp...

《Spark高级数据分析》pdf电子书百度网盘下载
《Spark高级数据分析》pdf电子书百度网盘下载


本书是使用Spark进行大规模数据分析的实战宝典,由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。

第1章 大数据分析  1
第2章 用Scala和Spark进行数据分析  7
第3章 音乐推荐和Audioscrobbler数据集  33
第4章  用决策树算法预测森林植被  51
第5章 基于K均值聚类的网络流量异常检测  71
第6章 基于潜在语义分析算法分析维基百科  89
第7章 用GraphX分析伴生网络  109
第8章 纽约出租车轨迹的空间和时间数据分析  135
第9章 基于蒙特卡罗模拟的金融风险评估  155
第10章 基因数据分析和BDG项目  175
第11章 基于PySpark和Thunder的神经图像数据分析  195



下载地址