如果你是一位在校大學生,對大數(shù)據感興趣,也知道使用的企業(yè)越來越多,市場需求更是日新月異,但苦于自己基礎不夠,心有余而力不足;也看過不少大數(shù)據方面的書籍、博客、視頻等,但感覺進步不大;如果你是一位在職人員,但目前主要使用傳統(tǒng)技術,雖然對大數(shù)據很有興趣,也深知其對未來的影響,但因時間不夠,雖有一定的基礎,常常也是打兩天魚、曬三天網,進展不是很理想。如果你有上述疑惑或遇到相似問題,本書正好比較適合你。本書從OpenStack云平臺搭建、軟件部署、需求開發(fā)實現(xiàn)到結果展示,以縱向角度講解了生產性大數(shù)據項目上線的整個流程;以完成一個實際項目需求貫穿各章節(jié),講述了Hadoop生態(tài)圈中互聯(lián)網爬蟲技術、Sqoop、Hive、HBase組件協(xié)同工作流程,并展示了Spark計算框架、R制圖軟件和SparkRHive組件的使用方法。本書的一大特色是提供了實際操作環(huán)境,用戶可以在線登錄云平臺來動手操作書中的數(shù)據和代碼,登錄網址請參考http://www.feiguyun.com/support。