本書從理解問題定義、了解數(shù)據(jù)內的高層信息、數(shù)據(jù)清理、視化數(shù)據(jù),到基礎建模、模型優(yōu)化,分享一個數(shù)據(jù)分析師的視角與思路。在預測分析的流程中,一步步用詳細的圖文代碼講解使用到的庫,如何正確使用各個庫中的方法和函數(shù),以及在遇到類似的問題時如何套用學過的知識。 本書共8章。第1章對預測分析的流程進行一個高層次的概述。第2章介紹本書需要安裝使用的庫,并講解數(shù)據(jù)清理步驟的執(zhí)行。第3章講解基礎建模需考慮的細節(jié),結合第4章的模型選擇,可以搭建一個基礎的預測管道。第5章和第6章分別從模型和數(shù)據(jù)的角度講解如何優(yōu)化預測表現(xiàn)。第7章講解時間序列這一特殊數(shù)據(jù)的預測方法。后,第8章總結全書學習到的內容,解決一個實戰(zhàn)問題。 本書面向3類讀者。第1類,有編程基礎但毫無數(shù)據(jù)科學背景,有意入門的讀者;第2類,有數(shù)據(jù)科學理論基礎,有意進入實操的讀者,如剛畢業(yè)沒有業(yè)界經驗的學生;第3類,有數(shù)據(jù)科學理論基礎與實操經驗,但日常工作集中在數(shù)據(jù)分析管道中的數(shù)據(jù)分析師。