注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡計算機科學理論與基礎知識深入云計算:Hadoop應用開發(fā)實戰(zhàn)詳解(修訂版)

深入云計算:Hadoop應用開發(fā)實戰(zhàn)詳解(修訂版)

深入云計算:Hadoop應用開發(fā)實戰(zhàn)詳解(修訂版)

定 價:¥59.80

作 者: 萬川梅 謝正蘭 著
出版社: 中國鐵道出版社
叢編項: 深入云計算
標 簽: 程序設計 計算機/網絡

購買這本書可以去


ISBN: 9787113186258 出版時間: 2014-08-04 包裝: 平裝
開本: 16開 頁數: 412 字數:  

內容簡介

  本書由淺入深,全面、系統地介紹了Hadoop這一高性能處理大量數據集的理想工具。本書內容主要包括HDFS、MapReduce、Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等與Hadoop相關的子項目,各個知識點都配有精心設計的大量經典的小案例,實戰(zhàn)性和可操作性強。<br>本書旨在幫助云計算初學者迅速掌握Hadoop系統,提升讀者在云計算實踐中的應用和開發(fā)能力。同時本書極強的系統性和大量翔實的案例對于有一定基礎的中高級用戶有非常好的參考價值。<br>

作者簡介

暫缺《深入云計算:Hadoop應用開發(fā)實戰(zhàn)詳解(修訂版)》作者簡介

圖書目錄

第1篇& ;& ;Hadoop技術篇<br>第& ;1章& ;& ;初識Hadoop<br>1.1& ;& ;Hadoop簡介& ;2<br>1.1.1& ;& ;Hadoop的起源& ;2<br>1.1.2& ;& ;什么是Hadoop& ;3<br>1.1.3& ;& ;Hadoop的核心技術是Google核心技術的開源實現& ;4<br>1.1.4& ;& ;Hadoop的功能與優(yōu)點& ;5<br>1.1.5& ;& ;Hadoop的應用現狀和發(fā)展趨勢& ;6<br>1.2& ;& ;Hadoop的體系結構& ;11<br>1.2.1& ;& ;HDFS的體系結構& ;12<br>1.2.2& ;& ;MapReduce的體系結構& ;19<br>1.3& ;& ;Hadoop與分布式開發(fā)& ;21<br>1.4& ;& ;Hadoop的數據管理& ;23<br>1.4.1& ;& ;HDFS的數據管理& ;23<br>1.4.2& ;& ;HBase的數據管理& ;23<br>1.4.3& ;& ;Hive的數據管理& ;24<br>1.5& ;& ;思考與總結& ;25<br>第& ;2章& ;& ;Hadoop的安裝和配置<br>2.1& ;& ;在Windows下安裝與配置Hadoop& ;27<br>2.1.1& ;& ;JDK的安裝& ;27<br>2.1.2& ;& ;Cygwin的安裝& ;30<br>2.1.3& ;& ;Hadoop的安裝& ;36<br>2.2& ;& ;在Linux下安裝與配置Hadoop& ;38<br>2.2.1& ;& ;Ubuntu的安裝& ;38<br>2.2.2& ;& ;JDK的安裝& ;41<br>2.2.3& ;& ;Hadoop的安裝& ;41<br>2.3& ;& ;Hadoop的執(zhí)行實例& ;43<br>2.3.1& ;& ;運行Hadoop& ;44<br>2.3.2& ;& ;運行wordcount.java程序& ;44<br>2.4& ;& ;Hadoop& ;Eclipse簡介和使用& ;45<br>2.4.1& ;& ;Eclipse插件介紹& ;45<br>2.4.2& ;& ;Eclipse插件開發(fā)配置& ;45<br>2.4.3& ;& ;在Eclipse下運行WordCount程序& ;49<br>2.5& ;& ;Hadoop的集群和優(yōu)化& ;56<br>2.5.1& ;& ;Hadoop的性能優(yōu)化& ;57<br>2.5.2& ;& ;Hadoop配置機架感知信息& ;58<br>2.6& ;& ;思考與總結& ;59<br>第& ;3章& ;& ;HDFS海量存儲<br>3.1& ;& ;開源的GFS——HDFS& ;60<br>3.1.1& ;& ;HDFS簡介& ;60<br>3.1.2& ;& ;HDFS的體系結構& ;63<br>3.1.3& ;& ;HDFS的保障可靠性措施& ;64<br>3.2& ;& ;HDFS的常用操作& ;67<br>3.2.1& ;& ;HDFS下的文件操作& ;67<br>3.2.2& ;& ;管理與更新& ;74<br>3.2.3& ;& ;HDFS& ;API詳解& ;76<br>3.2.4& ;& ;HDFS的讀/寫數據流& ;88<br>3.3& ;& ;用HDFS存儲海量的視頻數據& ;91<br>3.3.1& ;& ;場景分析& ;91<br>3.3.2& ;& ;設計實現& ;91<br>3.4& ;& ;思考與總結& ;93<br>第& ;4章& ;& ;初識MapReduce<br>4.1& ;& ;MapReduce簡介& ;94<br>4.1.1& ;& ;MapReduce要解決什么問題& ;94<br>4.1.2& ;& ;MapReduce的理論基礎& ;95<br>4.1.3& ;& ;MapReduce的編程模式& ;97<br>4.2& ;& ;MapReduce的集群行為& ;98<br>4.3& ;& ;Map/Reduce框架& ;100<br>4.4& ;& ;樣例分析:單詞計數& ;100<br>4.4.1& ;& ;WordCount實例的運行過程& ;100<br>4.4.2& ;& ;WordCount的源碼分析和程序處理過程& ;103<br>4.4.3& ;& ;MapReduce常用類及其接口& ;106<br>4.5& ;& ;實例:倒排索引& ;109<br>4.5.1& ;& ;倒排索引的分析和設計& ;109<br>4.5.2& ;& ;倒排索引完整源碼& ;112<br>4.5.3& ;& ;運行代碼結果& ;116<br>4.6& ;& ;MapReduce& ;在日志分析中數據去重案例& ;117<br>4.6.1& ;& ;什么是數據去重& ;117<br>4.6.2& ;& ;設計思路& ;118<br>4.6.3& ;& ;程序代碼& ;118<br>4.6.4& ;& ;代碼運行結果& ;120<br>4.7& ;& ;數據排序實例& ;122<br>4.7.1& ;& ;實例描述& ;122<br>4.7.2& ;& ;設計思路& ;123<br>4.7.3& ;& ;程序代碼& ;123<br>4.8& ;& ;思考與總結& ;126<br>第& ;5章& ;& ;分布式開源數據庫HBase<br>5.1& ;& ;HBase簡介& ;127<br>5.1.1& ;& ;HBase邏輯視圖& ;127<br>5.1.2& ;& ;HBase物理存儲& ;129<br>5.1.3& ;& ;子表Region服務器& ;130<br>5.1.4& ;& ;Hmaster主服務器& ;132<br>5.1.5& ;& ;元數據表& ;132<br>5.2& ;& ;HBase的安裝配置& ;133<br>5.2.1& ;& ;HBase單機模式& ;133<br>5.2.2& ;& ;HBase偽分布模式& ;135<br>5.2.3& ;& ;HBase完全分布模式& ;136<br>5.3& ;& ;學生成績表實例& ;140<br>5.3.1& ;& ;Shell的基本操作& ;141<br>5.3.2& ;& ;代碼實現& ;143<br>5.3.3& ;& ;關于中文的處理& ;145<br>5.3.4& ;& ;常用HBase的& ;Shell操作& ;149<br>5.4& ;& ;思考與總結& ;153<br>第& ;6章& ;& ;MapReduce進階<br>6.1& ;& ;API的配置& ;154<br>6.1.1& ;& ;一個簡單的配置文件& ;155<br>6.1.2& ;& ;合并多個源文件& ;156<br>6.1.3& ;& ;可變的擴展& ;157<br>6.2& ;& ;配置開發(fā)環(huán)境& ;157<br>6.2.1& ;& ;配置文件設置& ;157<br>6.2.2& ;& ;設置用戶標識& ;159<br>6.3& ;& ;復合鍵值對的使用& ;159<br>6.3.1& ;& ;小的鍵值對如何合并成大的鍵值對& ;159<br>6.3.2& ;& ;巧用復合鍵讓系統完成排序& ;160<br>6.4& ;& ;用戶定制數據類型& ;164<br>6.4.1& ;& ;內置數據類型& ;164<br>6.4.2& ;& ;用戶自定義數據類型& ;164<br>6.5& ;& ;用戶定制輸入/輸出格式& ;166<br>6.5.1& ;& ;內置數據的輸入格式& ;167<br>6.5.2& ;& ;用戶定制數據輸入格式與RecordReader& ;168<br>6.5.3& ;& ;Hadoop內置的數據輸出格式& ;172<br>6.5.4& ;& ;& ;Hadoop內置的數據輸出格式與RecordWriter& ;172<br>6.6& ;& ;用戶定制Partitioner和Combiner& ;173<br>6.7& ;& ;組合式的MapReduce作業(yè)& ;176<br>6.7.1& ;& ;MapReduce作業(yè)運行機制& ;176<br>6.7.2& ;& ;組合式MapReduce計算作業(yè)& ;178<br>6.8& ;& ;DataJoin連接多數據源& ;183<br>6.9& ;& ;思考與總結& ;187<br>第& ;7章& ;& ;Hive數據倉庫<br>7.1& ;& ;Hive簡介& ;188<br>7.2& ;& ;Hive安裝與配置& ;189<br>7.3& ;& ;Hive的服務& ;191<br>7.3.1& ;& ;Hive& ;shell& ;191<br>7.3.2& ;& ;JDBC/ODBC& ;192<br>7.3.3& ;& ;Thrift服務& ;192<br>7.3.4& ;& ;Web接口& ;193<br>7.3.5& ;& ;元數據服務& ;193<br>7.4& ;& ;HiveQL查詢語言& ;193<br>7.5& ;& ;Hive實例& ;202<br>7.5.1& ;& ;UDF& ;編程實例& ;202<br>7.5.2& ;& ;UDAF& ;編程實例& ;204<br>7.5.3& ;& ;Hive的日志數據統計實戰(zhàn)& ;206<br>7.6& ;& ;思考與總結& ;211<br>第& ;8章& ;& ;Pig開發(fā)應用<br>8.1& ;& ;Pig簡介& ;212<br>8.2& ;& ;Pig的安裝與配置& ;213<br>8.3& ;& ;Pig的使用& ;215<br>8.3.1& ;& ;Pig的MapReduce模式& ;215<br>8.3.2& ;& ;Pig的運行方式& ;216<br>8.4& ;& ;通過Grunt學習Pig& ;Latin& ;219<br>8.4.1& ;& ;Pig的數據模型& ;220<br>8.4.2& ;& ;運算符& ;221<br>8.4.3& ;& ;常用操作& ;222<br>8.4.4& ;& ;各種SQL在Pig中的實現& ;229<br>8.4.5& ;& ;Pig& ;Latin實現& ;233<br>8.5& ;& ;Pig使用的案例& ;235<br>8.6& ;& ;思考與總結& ;235<br>第& ;9章& ;& ;Chukwa數據收集系統<br>9.1& ;& ;Chukwa簡介& ;236<br>9.1.1& ;& ;Chukwa是什么& ;236<br>9.1.2& ;& ;Chukwa主要解決什么問題& ;240<br>9.2& ;& ;Chukwa的安裝配置& ;240<br>9.2.1& ;& ;Chukwa的安裝& ;240<br>9.2.2& ;& ;Chukwa的配置& ;242<br>9.2.3& ;& ;Chukwa的啟動& ;245<br>9.3& ;& ;Chukwa的基本命令& ;248<br>9.3.1& ;& ;Chukwa端的命令& ;248<br>9.3.2& ;& ;Agent& ;端的命令& ;249<br>9.4& ;& ;Chukwa在數據收集處理方面的運用& ;251<br>9.4.1& ;& ;數據生成& ;251<br>9.4.2& ;& ;數據收集& ;251<br>9.4.3& ;& ;數據處理& ;252<br>9.4.4& ;& ;數據析取& ;252<br>9.4.5& ;& ;數據稀釋& ;253<br>9.4.6& ;& ;數據顯示& ;253<br>9.5& ;& ;思考與總結& ;253<br>第& ;10章& ;& ;ZooKeeper開發(fā)應用<br>10.1& ;& ;ZooKeeper簡介& ;254<br>10.1.1& ;& ;ZooKeeper的設計目標& ;254<br>10.1.2& ;& ;ZooKeeper主要解決什么問題& ;256<br>10.1.3& ;& ;ZooKeeper的基本概念和工作原理& ;257<br>10.2& ;& ;ZooKeeper的安裝配置& ;260<br>10.2.1& ;& ;單機模式& ;261<br>10.2.2& ;& ;啟動并測試ZooKeeper& ;262<br>10.2.3& ;& ;集群模式& ;264<br>10.3& ;& ;ZooKeeper提供的接口& ;267<br>10.4& ;& ;ZooKeeper事件& ;270<br>10.5& ;& ;ZooKeeper實例& ;271<br>10.5.1& ;& ;實例1:一個簡單的應用——分布式互斥鎖& ;271<br>10.5.2& ;& ;實例2:進程調度系統& ;276<br>10.6& ;& ;思考與總結& ;283<br>第2篇& ;& ;Hadoop管理和容錯篇<br>第& ;11章& ;& ;Hadoop管理<br>11.1& ;& ;Hadoop權限管理& ;286<br>11.2& ;& ;HDFS文件系統管理& ;292<br>11.3& ;& ;Hadoop維護與管理& ;298<br>11.4& ;& ;Hadoop常見問題及解決辦法& ;300<br>11.5& ;& ;思考與總結& ;310<br>第& ;12章& ;& ;Hadoop容錯<br>12.1& ;& ;Hadoop的可靠性& ;311<br>12.1.1& ;& ;HDFS中的NameNode單點失效解決方案& ;311<br>12.1.2& ;& ;HDFS數據塊副本機制& ;313<br>12.1.3& ;& ;HDFS心跳機制& ;319<br>12.1.4& ;& ;HDFS負載均衡& ;320<br>12.1.5& ;& ;MapReduce容錯& ;321<br>12.2& ;& ;Hadoop的SecondayNameNode機制& ;322<br>12.2.1& ;& ;磁盤鏡像與日志文件& ;322<br>12.2.2& ;& ;SecondaryNameNode更新鏡像的流程& ;323<br>12.3& ;& ;Avatar機制& ;325<br>12.3.1& ;& ;Avatar機制簡介& ;325<br>12.3.2& ;& ;Avatars部署實戰(zhàn)& ;326<br>12.4& ;& ;Hadoop_HBase容錯& ;331<br>12.5& ;& ;思考與總結& ;333<br>第3篇& ;& ;Hadoop實戰(zhàn)篇<br>第& ;13章& ;& ;綜合實戰(zhàn)1:Hadoop中的數據庫訪問<br>13.1& ;& ;DBInputFormat類訪問數據庫& ;336<br>13.1.1& ;& ;在DBInputFormat類中包含的內置類& ;336<br>13.1.2& ;& ;使用DBInputFormat讀取數據庫表中的記錄& ;337<br>13.1.3& ;& ;使用示例& ;337<br>13.2& ;& ;使用DBOutputFormat向數據庫中寫記錄& ;340<br>13.3& ;& ;思考與總結& ;343<br>第& ;14章& ;& ;綜合實戰(zhàn)2:一個簡單的分布式的Grep<br>14.1& ;& ;分析與設計& ;344<br>14.2& ;& ;實現代碼& ;345<br>14.3& ;& ;運行程序& ;346<br>14.4& ;& ;思考與總結& ;346<br>第& ;15章& ;& ;綜合實戰(zhàn)3:打造一個搜索引擎<br>15.1& ;& ;搜索引擎工作原理& ;348<br>15.2& ;& ;網頁搜集與信息提取& ;350<br>15.2.1& ;& ;設計的主要思想& ;350<br>15.2.2& ;& ;系統設計目標& ;351<br>15.3& ;& ;網頁信息的提取與存儲& ;352<br>15.4& ;& ;MapReduce的預處理& ;353<br>15.4.1& ;& ;第一步:源數據過濾& ;353<br>15.4.2& ;& ;第二步:生成倒排文件& ;355<br>15.4.3& ;& ;第三步:建立二級索引& ;362<br>15.5& ;& ;建立Web信息查詢服務& ;365<br>15.6& ;& ;思考與總結& ;366<br>第& ;16章& ;& ;綜合實戰(zhàn)4:移動通信信令監(jiān)測與查詢<br>16.1& ;& ;分析與設計& ;367<br>16.1.1& ;& ;CDR數據文件的檢測與索引創(chuàng)建任務調度& ;369<br>16.1.2& ;& ;從HDFS讀取數據并創(chuàng)建索引& ;370<br>16.1.3& ;& ;查詢CDR信息& ;371<br>16.2& ;& ;代碼實現& ;371<br>16.2.1& ;& ;CDR文件檢測和索引創(chuàng)建任務程序& ;371<br>16.2.2& ;& ;讀取CDR數據和索引創(chuàng)建處理& ;375<br>16.2.3& ;& ;CDR查詢& ;383<br>16.3& ;& ;思考與總結& ;384<br>附錄A& ;& ;Hadoop命令大全& ;385<br>附錄B& ;& ;HDFS命令大全& ;392<br>

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號