当前位置: 首页 > 大数据

Hadoop构建数据仓库实践PDF电子书 [11MB]

  • 大数据
  • 更新时间:2021-03-21 21:39:15
简介《Hadoop构建数据仓库实践》是王雪迎于2017年由清华大学出版社出版的技术类书籍,旨在将传统数据仓库建模与Hadoop大数据平台技术结合,提供可扩展的数据仓库解决方案
全书系统阐述利用Sqoop、Hive、Oozie等Hadoop生态工具实现数据抽取、转换、装载及调度的全流程,涵盖渐变维度、代理键等维度...
《Hadoop构建数据仓库实践》pdf电子书百度网盘下载
《Hadoop构建数据仓库实践》pdf电子书百度网盘下载

《Hadoop构建数据仓库实践》是王雪迎于2017年由清华大学出版社出版的技术类书籍,旨在将传统数据仓库建模与Hadoop大数据平台技术结合,提供可扩展的数据仓库解决方案
全书系统阐述利用Sqoop、Hive、Oozie等Hadoop生态工具实现数据抽取、转换、装载及调度的全流程,涵盖渐变维度、代理键等维度建模关键技术,并整合Impala联机分析与Hue可视化工具的应用。书中融合理论架构与工程实践,详细解析Data Vault模型、ETL自动化及数据仓库生命周期管理等场景,涉及Hive优化、Kettle集成等具体技术实现。内容兼顾数据仓库设计基础与Hadoop平台适配方案,适用于大数据开发者和数据库管理员参考学习

作者简介:
王雪迎,毕业于中国地质大学计算机专业,高级工程师,拥有20年数据库、数据仓库相关技术经验。曾先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。

目录:
第1章 数据仓库简介
第2章 数据仓库设计基础
第3章 Hadoop生态圈与数据仓库
第4章 安装Hadoop
第5章 Kettle与Hadoop
第6章 建立数据仓库示例模型
第7章 数据抽取
第8章 数据转换与装载
第9章 定期自动执行ETL作业
第10章 维度表技术
第11章 事实表技术
第12章 联机分析处理
第13章 数据可视化

点击下载