《數(shù)據(jù)挖掘與應用:以SAS和R為工具(第二版)》是數(shù)據(jù)挖掘領域的經典教材,基于北京大學光華管理學院“數(shù)據(jù)挖掘與應用”課程。書中系統(tǒng)、全面地介紹了數(shù)據(jù)挖掘領域的理論、技術工具以及實踐方法。主要內容包括:數(shù)據(jù)挖掘方法論、數(shù)據(jù)理解和數(shù)據(jù)準備、缺失數(shù)據(jù)、關聯(lián)規(guī)則挖掘、多元統(tǒng)計降維、聚類分析、線性回歸和廣義線性回歸、回歸模型規(guī)則化、神經網絡、決策樹、支持向量機、模型評估、模型組合、協(xié)同過濾等?!性诿糠N數(shù)據(jù)挖掘技術后,均輔以大量醫(yī)療、金融、營銷、保險、政府部門等應用案例,并均配有相關應用的SAS和R語言代碼,以及視頻課程二維碼。 第二版更新:第二版在頭一版的基礎上,增加了缺失數(shù)據(jù)、回歸模型中的規(guī)則化和變量選擇、卷積神經網絡、支持向量機、協(xié)同過濾這5章內容。在已有各章內,本書亦增加了新的內容和示例。近些年來,R因為其自由、免費、開源,已經發(fā)展為數(shù)據(jù)分析領域強大的軟件之一。因此,本書除了繼續(xù)展示SAS程序,還增加了R程序。