在使用Apache Hadoop設計端到端數據管理解決方案時獲得專家級指導。當其他很多渠道還停留在解釋Hadoop生態(tài)系統(tǒng)中該如何使用各種紛繁復雜的組件時,這本專注實踐的書已帶領你從架構的整體角度思考,它對于你的特別應用場景而言是必不可少的,將所有組件緊密結合在一起,形成完整有針對性的應用程序。為了增強學習效果,《Hadoop應用架構(影印版 英文版)》第二部分提供了各種詳細的架構案例.涵蓋部分常見的Hadoop應用場景。無論你是在設計一個新的Hadoop應用還是正計劃將Hadoop整合到現有的數據基礎架構中,《Hadoop應用架構(影印版 英文版)》都將在這整個過程中提供技巧性的指導。使用Hadoop存放數據和建模數據時需要考慮的要素 在系統(tǒng)中導入數據和從系統(tǒng)中導出數據的實踐指導 數據處理的框架,包括MapReduce、Spark和Hive 常用Hadoop處理模式,例如移除重復記錄和使用窗口分析 Giraph,GraphX以及其他Hadoop上的大圖片處理工具 使用工作流協(xié)作和調度工具,例如Apache Oozie 使用Apache Storm、Apache Spark Streaming和Apache Flume處理準實時數據流 點擊流分析、欺詐防止和數據倉庫的架構實例