Spark是業(yè)界公認的近幾年發(fā)展快、受關注度的一體化多元化的大數(shù)據計算技術,可以同時滿足不同業(yè)務場景和不同數(shù)據規(guī)模的大數(shù)據計算的需要。 本書首先通過代碼實戰(zhàn)的方式對學習Spark前必須掌握的Scala內容進行講解并結合Spark源碼的閱讀來幫助讀者快速學習Scala函數(shù)式編程與面向對象完美結合的編程藝術,接著對Hadoop和Spark集群安裝部署以及Spark在不同集成開發(fā)環(huán)境的開發(fā)實戰(zhàn)作出了詳細的講解,然后基于大量的實戰(zhàn)案例來講解Spark核心RDD編程并深度解密RDD的密碼,并且通過實戰(zhàn)的方式詳解了TopN在Spark RDD中的實現(xiàn),為了讓讀者徹底了解Spark,本書用了大量的篇幅詳細解密了Spark的高可用性、內核架構、運行機制等內容。 Spark零基礎實戰(zhàn)這本書定位于零基礎的學員,也可以作為有一定大數(shù)據Hadoop經驗的從業(yè)者以及對大數(shù)據非常感興趣的學生的本Spark入門書籍。