

《Hadoop构建数据仓库实践》是王雪迎于2017年由清华大学出版社出版的技术类书籍,旨在将传统数据仓库建模与Hadoop大数据平台技术结合,提供可扩展的数据仓库解决方案
全书系统阐述利用Sqoop、Hive、Oozie等Hadoop生态工具实现数据抽取、转换、装载及调度的全流程,涵盖渐变维度、代理键等维度建模关键技术,并整合Impala联机分析与Hue可视化工具的应用。书中融合理论架构与工程实践,详细解析Data Vault模型、ETL自动化及数据仓库生命周期管理等场景,涉及Hive优化、Kettle集成等具体技术实现。内容兼顾数据仓库设计基础与Hadoop平台适配方案,适用于大数据开发者和数据库管理员参考学习
作者简介:
王雪迎,毕业于中国地质大学计算机专业,高级工程师,拥有20年数据库、数据仓库相关技术经验。曾先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。
目录:
第1章 数据仓库简介
第2章 数据仓库设计基础
第3章 Hadoop生态圈与数据仓库
第4章 安装Hadoop
第5章 Kettle与Hadoop
第6章 建立数据仓库示例模型
第7章 数据抽取
第8章 数据转换与装载
第9章 定期自动执行ETL作业
第10章 维度表技术
第11章 事实表技术
第12章 联机分析处理
第13章 数据可视化
点击下载