本書由校企“雙元”合作開發(fā),以企業(yè)真實項目的實施流程為主線,通過“電商平臺用戶行為數據分析”項目實戰(zhàn),貫穿Hadoop大數據核心技術,包括項目需求、大數據平臺部署、數據采集、離線數據倉庫設計與開發(fā)和項目數據可視化展示。本書內容主要涉及VMware、Xshell、IDEA等軟件的安裝配置;Hadoop分布式集群環(huán)境搭建; Flume、Kafka、Hive、Sqoop、ZooKeeper等Hadoop生態(tài)組件的基本工作原理、搭建及配置方法;使用Flume-Kafka-Flume架構實現數據采集;Hive離線數據倉庫的設計與開發(fā);使用pyecharts工具進行數據可視化展示。本書為省級精品在線開放課程配套教材,同時配有課程標準、軟件安裝包、項目源代碼、習題庫、微課視頻等,可以幫助讀者 好地學習本書內容。本書可以作為高等職業(yè)院校大數據、云計算、軟件技術等相關專業(yè)教材,也可以作為從事大數據平臺運維、大數據分析、云計算應用等技術人員的參考用書。