第一章 緒論
1.1 引言
1.2 KDD與數據挖掘
1.2.1 KDD定義
1.2.2 KDD過程
1.2.3 數據庫技術發(fā)展與數據挖掘
1.3 數據挖掘的對象與環(huán)境
1.3.1 數據與系統(tǒng)特征
1.3.2 數據結構
1.3.3 數據庫系統(tǒng)
1.4 數據挖掘方法與相關領域
1.4.1 數據挖掘相關領域
1.4.2 粗糙集
1.4.3聚類
1.4.4 關聯(lián)規(guī)則
決策樹
1.4.6 模糊集
1.4.7規(guī)則歸納
1.4.8 進化計算
1.5 KDD系統(tǒng)與應用
本章小結
習題一
第二章 數據預處理與數據倉庫
2.1 數據清理
2.1.1 填補空缺值
2.1.2 消除噪聲數據
2.1.3 實現(xiàn)數據一致性
2. 2 數據集成與轉換
2.2.1 數據集成
2.2.2 數據轉換
2.3 數據歸約與濃縮
2.3.1 數據立方體聚集
2.3.2 維歸約
2.3.3 數據壓縮
2.3.4數值歸約
2.4概念分層
2.4.1 概念分層的概念
2.4.2 概念分層的類型
2.4.3 數值數據的概念分層與離散化
2.4.4 分類數據的概念分層
2.5 數據倉庫與多維數據模型
2.5.1 數據倉庫的概念
2.5.2 數據倉庫中的數據組織
2.5.3數據立方體
2.5.4 多維數據庫模式
2.6 數據倉庫與數據挖掘
2.6.1 數據倉庫應用
2.6.2 數據挖掘和數據倉庫的關系
本章小結
習題二
第三章粗糙集
3.1 近似空間
3.1.1 近似空間與不可分辨關系
3.1.2 知識與知識庫
3.2近似與粗糙集
3.2.1 近似與粗糙集的基本概念
3.2.2 粗糙集的基本性質
3.3 粗糙集的特征描述
近似精度
3.3.2 粗糙集隸屬函數
3.3.3 拓撲特征
3.4知識約簡
3.4.1 約簡和核
3.4.2 相對約簡和相對核
3.5 知識的依賴性
3.6信息系統(tǒng)
3.6.1 信息系統(tǒng)的定義
3.6.2 分辨矩陣與分辨函數
3.7決策表
3.8決策規(guī)則
3.9 擴展的粗糙集模型
3.9.1 可變精度粗糙集模型(VPRS)
3.9.2 相似模型
本章小結
習題三
第四章 模糊集
4.1 模糊集定義與隸屬函數
4.1.1 模糊集定義與隸屬函數
4.1.2 模糊集合的表示法
4.2 模糊集的基本運算
4.3 分解定理與擴展原理
4.4模糊集的特征
4.5模糊集的度量
4.5.1 模糊度
4.5.2 模糊集間的距離
4.5.3 模糊集的貼近度
4.6模糊關系
4.6.1 模糊關系定義
4.6.2 模糊關系的運算與性質
4.6.3 模糊等價關系與模糊相似關系
4.7模糊聚類分析
4.7.1模糊劃分
4.7.2 模糊相似系數的標定方法
4.7.3 模糊聚類分析
4.7.4 傳遞閉包法
4.7.5最大樹法
4.7.6 模糊C均值聚類(FCM)
4.8 模糊集與粗糙集
本章小結
習題四
第五章 聚類分析
5.1 聚類分析簡介
5.2 聚類分析中的數據類型
5.3 劃分方法
5.3.1 k-均值算法
5.3.2 k-中心點算法
5.3.3 EM算法
5.4層次方法
5.4.1 凝聚的和分裂的層次聚類
5.4.2 利用層次方法進行平衡迭
代歸約和聚類
5.4了利用代表點聚類
5.4.4 采用動態(tài)建模技術的層次
聚類算法
5.5 基于密度的方法
5.6 基于網格的方法
5.7 基于模型的聚類方法
5.8孤立點分析
本章小結
習題五
第六章 關聯(lián)規(guī)則
6.1 引言
6.2 關聯(lián)規(guī)則基本模型
6. 2.. 1 關聯(lián)規(guī)則基本模型
6.2.2 Apriori算法
6.2.3 LIG算法
6,2,4 FP算法
6.3 多級關聯(lián)規(guī)則與多維關聯(lián)規(guī)則
6.3.1 多級關聯(lián)規(guī)則
6.3.2 多維關聯(lián)規(guī)則
6.4 關聯(lián)規(guī)則價值衡量與發(fā)展
6.4.1 規(guī)則價值衡量
6.4.2 基于約束的關聯(lián)規(guī)則
6.4.3 關聯(lián)規(guī)則新進展
本章小結
習題六
第七章 人工神經網絡
7.1 人工神經元及人工神經網絡模型
7.1.1 M-P模型
7.1.2 人工神經元的形式化描述
7.1.3 神經網絡的分類
7.1.4 人工神經網絡的學習方式
7.2前向神經網絡
7.2.1 感知器
7.2.2 多層前向神經網絡的BP算法
7.2.3 徑向基函數神經網絡
7.3 反饋神經網絡
7.3.1 前向神經網絡與反
饋神經網絡的比較
7.3.2 反饋神經網絡模型
7.3.3 離散型Hopfield神經網絡
7.3.4連續(xù)型Hopfield神經網絡
7.3.5 Boltzmann機
7.4 自組織競爭神經網絡模型
7.5 基于人工神經網絡的數據挖掘
本章小結
習題七
第八章 分類與預測
8.1 簡介
8.2決策樹
8.2.1,決策樹學習
8.2.2決策樹的剪枝
8.2.3 決策樹算法的改進
8.2.4 決策樹算法的可伸縮性
8.3 貝葉斯分類
8.3.1 貝葉斯公式
8.3.2 樸素貝葉斯分類
8.3.3 貝葉斯網絡
8.3.4 學習貝葉斯網絡
8.4基于遺傳算法分類
8.4.1 遺傳算法的發(fā)展
8.4.2 遺傳算法的基本原理
8.4.3基本遺傳算法
8.4.4 遺傳算法的基本實現(xiàn)技才
8.5 分類法的評估
8.5.1 評估分類法的精度
8.5.2 提高分類法的精度
8.6 預測
8.6.1 時間序列預測模型 .
8.6.2 線性回歸和多元回歸
8.6.3 非線性回歸
8.6.4 其他回歸模型,
8.6.5 馬爾可夫鏈
本章小結
習題八
第九章 多媒體數據挖掘
9.1 簡介
9.2多媒體數據庫
9.2.1 MM-DBMS體系結構
9.2.2 數據模型
9.2.3 MM-DBMS的功能
9.3 挖掘多媒體數據,
9.3.1概述
9.3.2文本挖掘
9.3.3 圖像挖掘
9.3.4視頻挖掘
9.3.5音頻挖掘
9.3.6 復合類型數據的挖掘
本章小結
習題九
參考文獻
名詞索引