本書包括五部分內容。第一部分(第1~3章)涉及數(shù)據挖掘技術的基礎知識,介紹數(shù)據挖掘的定義、數(shù)據挖掘工具及應用領域,數(shù)據挖掘的數(shù)學基礎內容,以及海量數(shù)據挖掘處理技術。第二部分(第4~5章)分別從聚類技術和離群點挖掘技術闡述聚類在語音區(qū)分、新聞分組、銷售策略制定、交通事故預測、欺詐檢測、入侵檢測、異常氣候檢測等方面的應用。第三部分(第6~11章)分別從決策樹、基于實例的學習、支持向量機、貝葉斯學習、人工神經網絡、遺傳算法在病情診斷、信用卡欺詐、機械裝備設計、法律案件審理、動物分類、垃圾郵件過濾、手寫文字識別、股票價格預測、人臉識別、音樂生成等方面闡述分類的應用。第四部分(第12章)闡述回歸數(shù)據挖掘技術的應用,涉及卡爾曼算法在股票價格預測、GPS定位方面的應用。第五部分(第13章)介紹推薦系統(tǒng)這個最典型的數(shù)據挖掘應用。附錄總結本書內容,闡述數(shù)據挖掘技術的數(shù)學本質。