第1章 大數(shù)據概述
1.1 大數(shù)據概念
1.2 大數(shù)據發(fā)展歷程
1.3 大數(shù)據特征
1.4 大數(shù)據技術
1.4.1 大數(shù)據采集與預處理
1.4.2 大數(shù)據存儲與管理
1.4.3 大數(shù)據計算模式
1.4.4 大數(shù)據分析與挖掘
1.4.5 大數(shù)據可視化
1.4.6 大數(shù)據隱私與安全保護
1.5 大數(shù)據應用場景
1.6 大數(shù)據職業(yè)
第2章 虛擬化集群環(huán)境
2.1 虛擬機的安裝
2.2 安裝CentOS系統(tǒng)
2.3 克隆CentOS系統(tǒng)
2.4 CentOS系統(tǒng)網絡配置
2.5 常用的Linux連接終端與文件上傳T具
第3章 Hadoop集群
3.1 Hadoop概述
3.1.1 Hadoop是什么
3.1.2 Hadoop發(fā)展進程
3.1.3 HDES
3.2 Linux時鐘同步
3.3 服務器配置
3.3.1 配置主機名
3.3.2 關閉防火墻
3.3.3 配置Hosts列表
3.4 JDK環(huán)境安裝
3.4.1 準備工作
3.4.2 安裝JDK
3.5 SSH免密碼登錄
3.6 搭建Hadoop集群
3.6.1 準備工作
3.6.2 安裝
3.6.3 配置
3.7 Hadoop Shell
3.7.1 Hadoop Shell概述
3.7.2 用戶命令
3.7.3 管理命令
3.7.4 FS Shell
第4章 Hadoop生態(tài)
4.1 Apache HBase
4.1.1 Apathe HBase概述
4.1.2 準備工作
4.1.3 Apache HBase安裝與配置
4.2 Apache-Pig
4.2.1 Apache Pig概述
4.2.2 準備工作
4.2.3 安裝與配置
4.2.4 Pig運行模式
4.3 Apache-Hive
4.3.1 準備工作
4.3.2 安裝與配置
4.4 Apache Mahout
4.4.1 準備工作
4.4.2 安裝與配置
4.5 Apache Sqoop
4.5.1 準備工作
4.5.2 安裝與配置
4.6 Apache Z00Keeper
4.6.1 準備工作
4.6.2 安裝與配置
第5章 MapReduce編程
5.1 MapReduce編程模型
5.1.1 Hadoop基本數(shù)據類型封裝
5.1.2 Mapper
5.1.3 Reducer
5.1.4 控制類
5.2 MapReduce開發(fā)環(huán)境搭建
5.2.1 JDK安裝
5.2.2 STS安裝
5.3 編寫MapReduee程序
5.3.1 英文單詞計數(shù)
5.3.2 最高氣溫計算
第6章 MapReduce數(shù)據分析實戰(zhàn)
6.1 網站PV分析
6.1.1 任務描述
6.1.2 數(shù)據來源
6.1.3 數(shù)據分析思路
6.1.4 數(shù)據分析
6.2 瀏覽器分析
6.2.1 任務描述
6.2.2 數(shù)據來源
6.2.3 數(shù)據分析思路
6.2.4 編寫MapReduce程序
6.2.5 數(shù)據可視化
6.3 招聘數(shù)據分析
6.3.1 任務描述
6.3.2 數(shù)據來源
6.3.3 數(shù)據分析思路
6.3.4 數(shù)據導入
6.3.5 數(shù)據分析
6.4 Online Judge數(shù)據分析
6.4.1 任務描述
6.4.2 數(shù)據來源
6.4.3 數(shù)據分析思路
6.4.4 HBase數(shù)據導入方式
6.4.5 導入數(shù)據到HBase
6.4.6 編寫MapRecluee程序分析數(shù)據
第7章 MapReduce推薦應用實戰(zhàn)
7.1 好友推薦
7.1.1 任務描述
7.1.2 數(shù)據來源
7.1.3 數(shù)據計算思路
7.1.4 計算好友列表
7.1.5 計算共同好友
7.1.6 打包執(zhí)行
7.2 電影推薦
7.2.1 任務描述
7.2.2 數(shù)據來源
7.2.3 數(shù)據計算思路
7.2.4 Join操作
7.2.5 推薦電影
7.3 新書推薦
7.3.1 任務描述
7.3.2 數(shù)據來源
7.3.3 Slope One算法
7.3.4 推薦思路
7.3.5 單機運行Mahout推薦算法
7.3.6 Hadoop集群模式運行Mahout推薦算法
第8章 MapReduce數(shù)據挖掘實戰(zhàn)
8.1 關聯(lián)規(guī)則挖掘
8.1.1 任務描述
8.1.2 數(shù)據來源
8.1.3 關聯(lián)規(guī)則挖掘概述
8.1.4 FP—Growth算法
8.1.5 數(shù)據挖掘過程
8.2 聚類分析
8.2.1 任務描述
8.2.2 數(shù)據來源
8.2.3 聚類概述
8.2.4 K-Means算法
8.2.5 Mabout聚類
8.3 數(shù)據分類
8.3.1 任務描述
8.3.2 數(shù)據來源
8.3.3 分類概述
8.3.4 樸素貝葉斯分類算法
8.3.5 Mabout分類
參考文獻