本書從初學者角度出發(fā),通過豐富的實例,詳細介紹了大數(shù)據(jù)開發(fā)環(huán)境和基本知識點的應用。全書內容包括:大數(shù)據(jù)系統(tǒng)基礎篇、Hadoop技術篇、Spark技術篇和項目實戰(zhàn)篇。大數(shù)據(jù)系統(tǒng)基礎篇講解Linux的安裝、Linux的使用和在Linux系統(tǒng)上安裝并使用MySQL;Hadoop技術篇講解Hadoop集群的搭建、Hadoop兩大核心的原理與使用、Hadoop生態(tài)圈的工具原理與使用(Hive、HBase、Sqoop、Flume等);Spark技術篇講解Spark集群的搭建、Scala語言、RDD、Spark SQL、Spark streaming和機器學習;項目實戰(zhàn)篇將真實的電力能源大數(shù)據(jù)分析項目作為實戰(zhàn)解讀,幫助初學者快速入門。本書所有知識點都結合具體實例和程序講解,便于讀者理解和掌握。本書適合作為高等院校計算機應用、大數(shù)據(jù)技術及相關專業(yè)的教材;也適合作為大數(shù)據(jù)開發(fā)入門者的自學用書,可快速提高開發(fā)技能。