注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計程序設計綜合Hadoop大數據技術與項目實戰(zhàn)

Hadoop大數據技術與項目實戰(zhàn)

Hadoop大數據技術與項目實戰(zhàn)

定 價:¥59.00

作 者: 王小潔,豐澤,陳炯
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121458965 出版時間: 2023-08-01 包裝: 平裝
開本: 16開 頁數: 1 字數:  

內容簡介

  本書由校企“雙元”合作開發(fā),以企業(yè)真實項目的實施流程為主線,通過“電商平臺用戶行為數據分析”項目實戰(zhàn),貫穿Hadoop大數據核心技術,包括項目需求、大數據平臺部署、數據采集、離線數據倉庫設計與開發(fā)和項目數據可視化展示。本書內容主要涉及VMware、Xshell、IDEA等軟件的安裝配置;Hadoop分布式集群環(huán)境搭建; Flume、Kafka、Hive、Sqoop、ZooKeeper等Hadoop生態(tài)組件的基本工作原理、搭建及配置方法;使用Flume-Kafka-Flume架構實現數據采集;Hive離線數據倉庫的設計與開發(fā);使用pyecharts工具進行數據可視化展示。本書為省級精品在線開放課程配套教材,同時配有課程標準、軟件安裝包、項目源代碼、習題庫、微課視頻等,可以幫助讀者 好地學習本書內容。本書可以作為高等職業(yè)院校大數據、云計算、軟件技術等相關專業(yè)教材,也可以作為從事大數據平臺運維、大數據分析、云計算應用等技術人員的參考用書。

作者簡介

  王小潔,女,副教授,山西職業(yè)技術學院,山西職業(yè)技術學院大數據技術專業(yè)是 \"雙高”建設專業(yè)群的龍頭專業(yè),與華為、新華三、中軟 等知名企業(yè)開展校企合作,在人才培養(yǎng)模式創(chuàng)新、課程教學資源建設、教材與教法改革、教師教學創(chuàng)新團隊等方面均進行改革創(chuàng)新。大數據技術專業(yè)每年招生200余人,具有一定 的專業(yè)規(guī)模。

圖書目錄

緒 論 1
學習目標 1
重點難點 1
學習方法 1
思考與練習 2
模塊1 項目需求 3
學習目標 3
項目概述 3
1.1 項目業(yè)務背景 3
1.2 項目實施計劃 5
1.2.1 項目實施流程規(guī)劃 5
1.2.2 技術選型及版本 6
1.2.3 項目實施的教學路徑 7
1.3 項目數據字典介紹 8
1.3.1 數據源數據結構字典 8
1.3.2 Hive表數據字典 13
素養(yǎng)園地 17
項目總結 17
思考與練習 17
模塊2 大數據平臺部署 20
學習目標 20
項目概述 20
2.1 大數據相關開發(fā)軟件安裝 20
2.2 Linux系統環(huán)境配置 28
2.2.1 安裝虛擬機 28
2.2.2 克隆虛擬機 50
2.2.3 虛擬機免密碼登錄配置 57
2.2.4 Linux項目路徑規(guī)劃 70
2.3 Hadoop分布式集群環(huán)境搭建 73
2.3.1 JDK安裝配置 73
2.3.2 Hadoop框架介紹及組成 77
2.3.3 HDFS集群配置 79
2.3.4 YARN集群配置 89
2.3.5 HDFS Shell命令行操作 95
2.3.6 HDFS客戶端開發(fā)環(huán)境配置及測試 98
2.3.7 HDFS API基本操作 115
2.3.8 MapReduce原理 121
2.3.9 MapReduce案例――詞頻統計 122
2.4 Hive數據倉庫服務配置 131
2.4.1 MySQL環(huán)境配置 131
2.4.2 Hive環(huán)境配置 135
2.4.3 Hive與MySQL整合操作及Hive服務啟動 138
2.4.4 HQL語句基本操作 141
2.4.5 HQL統計分析案例 143
2.5 Flume原理及安裝部署 144
2.6 Sqoop原理及應用 145
2.6.1 Sqoop原理及安裝部署 146
2.6.2 Sqoop數據遷移案例 147
2.7 ZooKeeper集群環(huán)境搭建 151
2.8 Kafka集群環(huán)境搭建及應用 154
2.8.1 Kafka集群環(huán)境搭建 154
2.8.2 Kafka常用命令及使用方法 157
素養(yǎng)園地 159
項目總結 160
思考與練習 161
模塊3 數據采集 165
學習目標 165
項目概述 165
3.1 項目數據源及產生方法 165
3.2 Flume腳本設計 167
3.2.1 Flume采集原理及流程 167
3.2.2 Flume數據采集腳本設計 170
3.2.3 攔截器鏈的創(chuàng)建流程 172
3.2.4 ETL攔截器業(yè)務邏輯分析 182
3.2.5 分流標記攔截器業(yè)務邏輯分析 183
3.2.6 Flume數據采集執(zhí)行腳本及實現 184
3.2.7 Flume數據消費腳本設計 187
3.2.8 Flume數據消費執(zhí)行腳本及實現 191
素養(yǎng)園地 195
項目總結 195
思考與練習 195
模塊4 離線數據倉庫設計與開發(fā) 198
學習目標 198
項目概述 198
4.1 離線數據倉庫概述 198
4.2 ODS層設計與開發(fā) 199
4.3 DWD層設計與開發(fā) 204
4.3.1 項目JSON解析函數及應用 204
4.3.2 啟動日志表設計及數據加載 206
4.4 DWS層設計與開發(fā) 209
4.5 DWT層設計與開發(fā) 212
4.5.1 HQL關聯查詢(1) 212
4.5.2 HQL關聯查詢(2) 216
4.5.3 HQL關聯查詢(3) 218
4.5.4 設備主題表設計及數據加載 219
4.6 ADS層設計與開發(fā) 222
4.6.1 活躍用戶數據表設計及數據加載 223
4.6.2 每日新增用戶數據表設計及數據加載 224
4.6.3 沉默用戶數據表設計及數據加載 226
4.6.4 本周回流用戶數據表設計及數據加載 228
4.6.5 用戶留存率數據表設計及數據加載 229
素養(yǎng)園地 243
項目總結 243
思考與練習 243
模塊5 項目數據可視化展示 246
學習目標 246
項目概述 246
5.1 創(chuàng)建MySQL數據表 246
5.1.1 大數據報表系統 246
5.1.2 MySQL數據表的創(chuàng)建 247
5.2 Sqoop數據遷移 248
5.3 數據可視化 250
5.3.1 pyecharts可視化工具介紹 251
5.3.2 導入數據、繪制大屏標題 269
5.3.3 繪制柱狀圖 283
5.3.4 繪制象形柱狀圖、水球圖 287
5.3.5 繪制柱狀圖與折線圖的疊加圖 291
5.3.6 繪制輪播圖 294
5.3.7 數據大屏展示 297
素養(yǎng)園地 301
項目總結 301
思考與練習 301
課程學習成果評價 304
參考文獻 306

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號