定 價:¥59.00
作 者: | 曹潔 |
出版社: | 清華大學(xué)出版社 |
叢編項: | 面向新工科專業(yè)建設(shè)計算機系列教材 |
標 簽: | 暫缺 |
ISBN: | 9787302625520 | 出版時間: | 2023-03-01 | 包裝: | 平裝 |
開本: | 16開 | 頁數(shù): | 字數(shù): |
第1章 大數(shù)據(jù)技術(shù)概述
1.1 大數(shù)據(jù)的基本概念
1.1.1 大數(shù)據(jù)的定義
1.1.2 大數(shù)據(jù)的特征
1.1.3 大數(shù)據(jù)思維
1.2 代表性大數(shù)據(jù)技術(shù)
1.2.1 Hadoop
1.2.2 Spark
1.2.3 Flink
1.3 大數(shù)據(jù)編程語言
1.4 在線資源
1.5 拓展閱讀——三次信息化浪潮的啟示
1.6 習(xí)題
第2章 Spark大數(shù)據(jù)處理框架
2.1 Spark概述
2.1.1 Spark的產(chǎn)生背景
2.1.2 Spark的優(yōu)點
2.1.3 Spark的應(yīng)用場景
2.1.4 Spark的生態(tài)系統(tǒng)
2.2 Spark運行機制
2.2.1 Spark基本概念
2.2.2 Spark運行架構(gòu)
2.3 在VirtualBox上安裝Linux集群
2.3.1 Master節(jié)點的安裝
2.3.2 虛擬機克隆安裝Slavel節(jié)點
2.4 Hadoop安裝前的準備工作
2.4.1 創(chuàng)建hadoop用戶和更新APT
2.4.2 安裝SSH、配置SSH無密碼登錄
2.4.3 安裝Java環(huán)境
2.4.4 Linux系統(tǒng)下Scala版本的Eclipse的安裝與配置
2.4.5 Eclipse環(huán)境下Java程序開發(fā)實例
2.5 Hadoop的安裝與配置
2.5.1 下載Hadoop安裝文件
2.5.2 Hadoop單機模式配置
2.5.3 Hadoop偽分布式模式配置
2.5.4 Hadoop分布式模式配置
2.6 Spark的安裝與配置
2.6.1 下載Spark安裝文件
2.6.2 單機模式配置
2.6.3 偽分布式模式配置
2.7 使用PySpark編寫Python代碼
2.8 安裝pip工具和常用的數(shù)據(jù)分析庫
2.9 安裝Anaconda和配置Jupyter Notebook
2.9.1 安裝Anaconda
2.9.2 配置Jupyter Notebook
2.9.3 運行Jupyter Notebook
2.9.4 配置Jupyter Notebook實現(xiàn)和PySpark交互
2.9.5 為Anaconda安裝擴展庫
2.10 拓展閱讀——Spark誕生的啟示
2.11 習(xí)題
……
第3章 Spark RDD編程
第4章 Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理
第5章 HBase分布式數(shù)據(jù)庫
第6章 Spark Streaming流計算
第7章 Spark MLlib機器學(xué)習(xí)
第8章 數(shù)據(jù)可視化
參考文獻