“大數據”已連年入選IT領域的熱點話題,人們每天都會通過互聯網、移動設備等生產大量數據。如何從海量數據中洞悉出隱藏其后的見解是當今社會各領域人士極為關注的話題。本系列圖書以“大數據分析師”應掌握的IT技術為主線,共分兩卷,以7個模塊(第1卷包括4個模塊,第2卷包括3個模塊)分別介紹大數據入門,分析和R編程入門,使用R進行數據分析,用R進行高級分析,機器學習的概念,社交媒體、移動分析和可視化,大數據分析的行業(yè)應用等核心內容,全面且詳盡地涵蓋了大數據分析的各個領域。本書為第1卷,首先提供大數據的概覽,介紹大數據概念及其在商業(yè)中的應用、處理大數據的技術、Hadoop生態(tài)系統(tǒng)和MapReduce的相關內容,然后介紹如何理解分析、分析方法與工具,重點講解流行分析工具R,介紹如何將數據集導入R和從R導出數據、在R中如何操縱和處理數據,最后詳細介紹R中的函數和包、R的描述性統(tǒng)計、R中的圖形分析、R中的假設檢驗、R中的線性回歸、非線性回歸、聚類分析、決策樹、R和Hadoop的集成及Hive,通過這些實戰(zhàn)內容,使讀者掌握R語言在數據分析中的全面應用。通過本書,讀者能對大數據概念、重要性及其應用有全面的了解,熟悉各種大數據分析工具。本書適用于想成為大數據分析師的人員以及所有對大數據分析感興趣的技術人員和決策者閱讀。