注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書教育/教材/教輔教材高職高專教材Hadoop+HBase技術(shù)項目教程

Hadoop+HBase技術(shù)項目教程

Hadoop+HBase技術(shù)項目教程

定 價:¥59.00

作 者: 張立輝,李明革
出版社: 機械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787111705239 出版時間: 2022-06-01 包裝:
開本: 16開 頁數(shù): 218 字數(shù):  

內(nèi)容簡介

  本書詳細介紹了大數(shù)據(jù)技術(shù)中的Hadoop 集群部署、MapReduce、Hive和HBase 等的基本知識和應(yīng)用,本書采用了大量案例,可以更好地幫助讀者學(xué)習(xí)和理解大數(shù)據(jù)的核心技術(shù)。 \n本書從實用的角度出發(fā),設(shè)計了9 個項目,從虛擬機安裝入手,結(jié)合實際工作中的典型項目和案例,全面介紹了Hadoop 集群部署、HDFS、MapReduce 編程、Hive、HBase 和Sqoop 的相關(guān)知識和基本操作。 \n本書圍繞Linux 操作系統(tǒng)和Hadoop 集群部署,按照初學(xué)者的思維習(xí)慣,循序漸進地設(shè)計和安排學(xué)習(xí)內(nèi)容,采用將基礎(chǔ)知識融入項目教學(xué)的方式,在完成項目學(xué)習(xí)的同時,實現(xiàn)從理論知識到能力的轉(zhuǎn)化,幫助學(xué)習(xí)者牢固掌握Hadoop 集群部署等相關(guān)知識的實踐技能。 \n本書適合作為職業(yè)類院校計算機、大數(shù)據(jù)等相關(guān)專業(yè)的教材,也適用于計算機培訓(xùn)班教學(xué),以及有構(gòu)建大數(shù)據(jù)知識體系需求的讀者學(xué)習(xí)。

作者簡介

  張立輝,2003年畢業(yè)于吉林工程技術(shù)師范學(xué)院計算機科學(xué)與技術(shù)專業(yè),發(fā)表核心論文一篇,論文10余篇,主持和參與課題5個,指導(dǎo)學(xué)生參加吉林省大數(shù)據(jù)比賽多次獲得一等獎,實用新型專利3個,軟件著作權(quán)4個。帶領(lǐng)團隊參與公司實際項目3個以上。

圖書目錄

目錄 \n
\n
前言 \n
項目1 Hadoop 安裝 \n
1.1 大數(shù)據(jù)認知 \n
1.1.1 大數(shù)據(jù)是什么 \n
1.1.2 大數(shù)據(jù)應(yīng)用領(lǐng)域 \n
1.1.3 大數(shù)據(jù)的特點 \n
1.1.4 大數(shù)據(jù)的技術(shù)架構(gòu) \n
1.2 Hadoop 認知 \n
1.2.1 Hadoop 起源 \n
1.2.2 Hadoop 的特點 \n
1.2.3 Hadoop 生態(tài)圈 \n
1.2.4 Hadoop 核心架構(gòu) \n
項目實現(xiàn) \n
任務(wù)1 安裝前準備 \n
任務(wù)2 虛擬機的安裝 \n
任務(wù)3 Ubuntu 的安裝 \n
任務(wù)4 解壓與壓縮命令 \n
任務(wù)5 JDK 安裝和配置 \n
任務(wù)6 Hadoop 的安裝 \n
拓展項目 \n
課后練習(xí) \n
項目2 Hadoop 集群部署 \n
2.1 Linux 環(huán)境設(shè)置 \n
2.1.1 Linux 常用命令 \n
2.1.2 用戶(組)創(chuàng)建 \n
2.1.3 FileZilla 文件傳輸 \n
2.1.4 apt 更新 \n
2.1.5 vim 編輯器的應(yīng)用 \n
2.1.6 網(wǎng)絡(luò)配置 \n
2.2 Hadoop 配置文件 \n
2.2.1 環(huán)境變量的配置 \n
2.2.2 SSH 安裝 \n
2.2.3 core-site.xml 配置文件 \n
2.2.4 hdfs-site.xml 配置文件 \n
2.2.5 Hadoop 偽分布式運行實例 \n
2.3 YARN 認知 \n
2.3.1 初識YARN \n
2.3.2 YARN 基本服務(wù)組件 \n
2.3.3 YARN 執(zhí)行過程 \n
項目實現(xiàn) \n
任務(wù)1 部署前準備 \n
任務(wù)2 集群網(wǎng)絡(luò)配置 \n
任務(wù)3 配置文件的設(shè)置 \n
任務(wù)4 集群部署 \n
拓展項目 \n
課后練習(xí) \n
項目3 HDFS-電影信息管理 \n
3.1 HDFS 認知 \n
3.1.1 HDFS 簡介 \n
3.1.2 HDFS 特點 \n
3.1.3 HDFS 設(shè)計原則 \n
3.1.4 HDFS 核心概念 \n
3.2 HDFS 常用Shell 命令和基礎(chǔ)編程開發(fā) \n
3.2.1 HDFS 常用Shell 命令 \n
3.2.2 用HDFS API 實現(xiàn)上傳本地文件 \n
3.2.3 用HDFS API 實現(xiàn)創(chuàng)建HDFS 文件 \n
3.2.4 用HDFS API 實現(xiàn)讀取和寫入文件 \n
3.2.5 用HDFS API 實現(xiàn)創(chuàng)建HDFS 目錄 \n
3.2.6 用HDFS API 實現(xiàn)查找文件所在位置 \n
3.3 HDFS 工作機制 \n
3.3.1 HDFS 寫數(shù)據(jù)流程 \n
3.3.2 HDFS 讀數(shù)據(jù)流程 \n
3.3.3 NameNode 工作機制 \n
3.3.4 DataNode 工作機制 \n
項目實現(xiàn) \n
任務(wù)1 環(huán)境搭建 \n
任務(wù)2 寫入電影信息 \n
任務(wù)3 讀取電影信息 \n
拓展項目 \n
課后練習(xí) \n
項目4 用MapReduce 統(tǒng)計網(wǎng)站最大訪問次數(shù) \n
4.1 MapReduce 認知 \n
4.1.1 MapReduce 的由來 \n
4.1.2 MapReduce 的執(zhí)行過程 \n
4.1.3 Mapper 過程 \n
4.1.4 Reduce 過程 \n
4.1.5 Shuffle 過程 \n
4.2 MapReduce 程序開發(fā) \n
4.2.1 IDEA 安裝 \n
4.2.2 MapReduce 輸入/輸出類型 \n
4.2.3 MapReduce 輸入處理類 \n
4.2.4 MapReduce 輸出處理類 \n
4.2.5 典型案例:WordCount \n
項目實現(xiàn) \n
任務(wù)1 POJO 類編寫 \n
任務(wù)2 Map 網(wǎng)站訪問數(shù)據(jù) \n
任務(wù)3 Reduce 網(wǎng)站訪問數(shù)據(jù) \n
任務(wù)4 項目驅(qū)動類編寫 \n
拓展項目 \n
課后練習(xí) \n
項目5 用MapReduce 實現(xiàn)課程名稱和成績的二次排序 \n
5.1 MapReduce 高級開發(fā)一 \n
5.1.1 Combiner 合并編程 \n
5.1.2 Partitioner 分區(qū)編程 \n
5.1.3 RecordReader 編程 \n
5.2 MapReduce 高級開發(fā)二 \n
5.2.1 MapReduce 連接操作 \n
5.2.2 MapReduce 排序操作 \n
5.2.3 MapReduce 多文件聯(lián)合查詢 \n
項目實現(xiàn) \n
任務(wù)1 POJO 類編寫 \n
任務(wù)2 Map 課程和成績數(shù)據(jù) \n
任務(wù)3 Reduce 課程和成績數(shù)據(jù) \n
任務(wù)4 項目驅(qū)動類編寫 \n
拓展項目 \n
課后練習(xí) \n
項目6 用Hive 實現(xiàn)購物用戶數(shù)據(jù)清洗 \n
6.1 Hive 認知 \n
6.1.1 Hive 簡介 \n
6.1.2 Hive 體系結(jié)構(gòu) \n
6.1.3 Hive 設(shè)計特征 \n
6.2 Hive 安裝 \n
6.2.1 偽分布式安裝與配置Hive \n
6.2.2 安裝與配置MySQL \n
6.3 Hive 基本操作 \n
6.3.1 Hive 數(shù)據(jù)類型 \n
6.3.2 數(shù)據(jù)庫操作 \n
6.3.3 內(nèi)部表操作 \n
6.3.4 外部表操作 \n
6.3.5 分區(qū)表操作 \n
6.3.6 分桶表操作 \n
6.3.7 Hive 數(shù)據(jù)操作 \n
項目實現(xiàn) \n
任務(wù)1 導(dǎo)入數(shù)據(jù) \n
任務(wù)2 數(shù)據(jù)分析 \n
任務(wù)3 數(shù)據(jù)導(dǎo)出 \n
拓展項目 \n
課后練習(xí) \n
項目7 用HBase 實現(xiàn)學(xué)生成績管理 \n
7.1 HBase 認知 \n
7.1.1 HBase 簡介 \n
7.1.2 HBase 體系結(jié)構(gòu) \n
7.1.3 HBase 寫數(shù)據(jù)流程 \n
7.1.4 HBase 讀數(shù)據(jù)流程 \n
7.2 HBase 安裝 \n
7.2.1 下載軟件 \n
7.2.2 偽分布式安裝與配置 \n
7.3 HBase shell 操作命令 \n
7.3.1 HBase 數(shù)據(jù)模型 \n
7.3.2 數(shù)據(jù)表空間操作 \n
7.3.3 數(shù)據(jù)表操作 \n
7.3.4 數(shù)據(jù)操作 \n
7.4 HBase API 操作 \n
7.4.1 HBase 常用的API \n
7.4.2 Configuration 對象 \n
7.4.3 HTable 句柄創(chuàng)建 \n
7.4.4 HBase 數(shù)據(jù)的CRUD 操作 \n
項目實現(xiàn) \n
任務(wù)1 學(xué)生成績表數(shù)據(jù)準備 \n
任務(wù)2 學(xué)生成績表設(shè)計分析 \n
任務(wù)3 學(xué)生成績表代碼實現(xiàn) \n
拓展項目 \n
課后練習(xí) \n
項目8 Sqoop 導(dǎo)入導(dǎo)出 \n
8.1 概述 \n
8.1.1 Sqoop 產(chǎn)生背景 \n
8.1.2 Sqoop 是什么 \n
8.1.3 為什么選擇 Sqoop \n
8.2 工作原理 \n
8.2.1 導(dǎo)入機制 \n
8.2.2 導(dǎo)出機制 \n
8.3 安裝 \n
8.4 Sqoop 的基本命令 \n
8.4.1 基本操作 \n
8.4.2 示例 \n
項目實現(xiàn) \n
任務(wù)1 從RDBMS 導(dǎo)入到HDFS \n
任務(wù)2 從MySQL 導(dǎo)入到Hive \n
任務(wù)3 從MySQL 導(dǎo)入到HBase \n
課后練習(xí) \n
Hadoop 綜合實例—網(wǎng)絡(luò)交易數(shù)據(jù)統(tǒng)計 \n
9.1 項目概述 \n
9.1.1 項目實現(xiàn)的思路 \n
9.1.2 項目流程 \n
9.2 準備工作 \n
9.2.1 項目環(huán)境的搭建 \n
9.2.2 Hadoop+HBase+Hive 集成 \n
9.2.3 HBase 數(shù)據(jù)庫設(shè)計原則 \n
9.2.4 數(shù)據(jù)概況 \n
項目實現(xiàn) \n
項目9 \n
任務(wù)1 POJO 類編寫 \n
任務(wù)2 統(tǒng)計不同品牌手機的銷售數(shù)量 \n
任務(wù)3 統(tǒng)計不同品牌手機銷量和銷售額占比 \n
任務(wù)4 統(tǒng)計某年每個月的手機銷售數(shù)量的比例 \n
任務(wù)5 統(tǒng)計每個月份各市區(qū)縣的手機銷售數(shù)量 \n
任務(wù)6 統(tǒng)計購買手機的男女比例 \n
任務(wù)7 統(tǒng)計不同手機品牌購買用戶的年齡區(qū)間人數(shù) \n
課后練習(xí)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號