作為一本教科書,本書全面講述了數(shù)據(jù)挖掘的概念、模型、方法和算法。本書共包括13章和2個附錄,全面、詳細地講述了從數(shù)據(jù)挖掘的基本概念到數(shù)據(jù)挖掘的整個過程,以及數(shù)據(jù)挖掘工具及其典型應用領域。本收編寫嚴謹、內容權威、結構合理、科學規(guī)范、語言流暢,特別適合作為高等院校數(shù)據(jù)挖掘課程的教科書,還適合作為數(shù)據(jù)挖掘研究人員必備的參考書。我們被數(shù)據(jù)所包圍著,這些數(shù)據(jù)是數(shù)值型或其他類型,它們都必須經過分析和處理,轉換成通知、指導、回答或輔助決策和理解的信息。由于當今數(shù)據(jù)集的大小和復雜性的增加,就產生了數(shù)據(jù)挖掘這個新術語,它描述了間接的、自動化的數(shù)據(jù)分析技術,這些技術所利用的工具比分析人員過去做基本的數(shù)據(jù)分析所使用的工具更加復雜和尖端。本書討論了數(shù)據(jù)挖掘的原理,接著描述了一些具有代表性的藝術級的方法和算法。這些方法和算法起源于不同的學科,如統(tǒng)計學、機器學習、計算機圖形學、數(shù)據(jù)庫、信息檢索、神經網絡、模糊邏輯和進化計算。本書還提供了詳細的算法,而且這些算法都帶有必要的解釋和圖形示例。本書提供了一個指南:在面對一個待挖掘的數(shù)據(jù)集(以及它們的伴隨數(shù)據(jù)集)時,怎樣和何時從成百上千種軟件工具中選擇特定的一種。本書允許分析人員用書中提供的方法和技術來創(chuàng)建和執(zhí)行他們自己的數(shù)據(jù)挖掘實驗。本書強調選擇合適的方法和數(shù)據(jù)分析軟件,并根據(jù)實際情況選擇相應的參數(shù)。只有在深入理解了參數(shù)的意義及其在所提供技術中的作用的情況下,才能作出這些非常重要的、定性的決策。數(shù)據(jù)挖掘是一個正在蓬勃發(fā)展的領域,本書提供了從大量可用的分析程序中進行選擇所急需的指南。