HADOOP生态案例详解与项目实战

2025-8-26 123 8/26

HADOOP生态案例详解与项目实战

作者:王盟 王新强

页数:214

出版社:机械工业出版社

出版日期:2023

ISBN:9787111732372

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

本书按照大数据开发流程系统介绍了Hadoop生态系统的核心开发技术,包括环境准备、文件存储与数据采集、数据处理与分析、数据库存储与数据迁移,并通过实际案例,详细直观地介绍了大数据分析的实现过程。本书从Hadoop的概念开始,深入浅出地讲解了Hadoop组件的作用及使用方法,内容系统全面,可帮助开发人员快速实现大数据的离线分析。本书可作为各类职业院校大数据技术及相关专业的教材,也可作为相关技术人员的参考用书。本书配有电子课件和习题,选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)免费注册后进行下载,或联系编辑(010-88379194)咨询。

目录

前 言
项目1 环境准备1
任务 Hadoop环境部署3
小结25
项目2 文件存储与数据采集27
任务1 HDFS分布式存储数据文件29
任务2 Flume收集流量数据65
小结87
项目3 数据处理与分析89
任务1 MapReduce清洗计算流量数据91
任务2 Hive分析流量数据121
小结153
项目4 数据库存储与数据迁移155
任务1 HBase数据库存储流量数据157
任务2 Sqoop迁移数据库数据195
小结214
参考文献215
PDF更新中
- THE END -

非特殊说明,本博所有文章均为博主原创。