知識發(fā)現(xiàn)

定　價：￥38.00

作　者：	史忠植著
出版社：	清華大學出版社
叢編項：	中國計算機學會學術著作叢書
標　簽：	暫缺

購買這本書可以去

ISBN：	9787302050612	出版時間：	2002-01-01	包裝：	精裝
開本：	26cm	頁數(shù)：	416	字數(shù)：

內容簡介

　　知識發(fā)現(xiàn)是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的，以及最終可理解的模式的非平凡過程。知識發(fā)現(xiàn)將信息變?yōu)橹R，從數(shù)據(jù)礦山中找到蘊藏的知識金塊，將為知識創(chuàng)新和知識經濟的發(fā)展作出貢獻。本書全面而又系統(tǒng)地介紹了知識發(fā)現(xiàn)的方法和技術，反映了當前知識發(fā)現(xiàn)研究的最新成果。全書共分11章。第1章是緒論，介紹知識發(fā)現(xiàn)的重要概念和任務。第2章討論決策樹，它是歸納學習方法中最實用的一種技術。關聯(lián)規(guī)則挖掘是近幾年應用最為廣泛的方法，第3章將對重要的關聯(lián)規(guī)則挖掘算法進行討論。第4章討論范例推理，它是一種有效的實用技術。第5章探討模糊聚類法。第6章討論粗糙集。第7章是貝葉斯網絡，貝葉斯網絡可以處理不完整和帶有噪聲的數(shù)據(jù)集，它用概率測度的權重來描述數(shù)據(jù)間的相關性。第8章探討支持向量機，它在近幾年知識發(fā)現(xiàn)研究中是極其活躍的研究課題。第9章討論隱馬爾科夫模型。第10章是神經網絡，書中著重介紹幾種實用的算法。第11章討論進化和遺傳算法。第12章介紹知識發(fā)現(xiàn)平臺MSMiner。接著，以Web知識發(fā)現(xiàn)、生物信息處理為例，介紹知識發(fā)現(xiàn)的應用。第13章關于Web知識發(fā)現(xiàn)。第14章介紹生物信息處理中基因組模式的發(fā)現(xiàn)。本書內容新穎，認真總結了作者的科研成果，取材國內外最新資料，反映了當前該領域的研究水平。論述力求概念清晰，表達準確，突出理論聯(lián)系實際，通過實例說明原理，富有啟發(fā)性。本書對從事知識發(fā)現(xiàn)、數(shù)據(jù)挖掘、機器學習、人工智能研究和知識管理的科技人員具有重要參考價值，可以用作計算機、信息技術等專業(yè)博士生、碩士生的教材。

作者簡介

暫缺《知識發(fā)現(xiàn)》作者簡介

圖書目錄

前言
第1章緒論
1.1 知識
1.2 知識發(fā)現(xiàn)
1.3 知識發(fā)現(xiàn)的任務
1.3.1 數(shù)據(jù)總結
1.3.2 概念描述
1.3.3 分類
1.3.4 聚類
1.3.5 相關性分析
1.3.6 偏差分析
1.3.7 建模
1.4 知識發(fā)現(xiàn)的方法
1.4.1 統(tǒng)計方法
1.4.2 機器學習
1.4.3 神經計算
1.4.4 可視化
1.5 知識發(fā)現(xiàn)的對象
1.5.1 數(shù)據(jù)庫
1.5.2 文本
1.5.3 Web信息
1.5.4 空間數(shù)據(jù)
1.5.5 圖像和視頻數(shù)據(jù)
1.6 知識發(fā)現(xiàn)與創(chuàng)新
第2章決策樹
2.1 歸納學習
2.2 決策樹學習
2.3 CLS學習算法
2.4 ID3學習算法
2.4.1 信息論簡介
2.4.2 信息論在決策樹學習中的意義及應用
2.4.3 ID3算法
2.4.4 ID3算法應用舉例
2.5 決策樹的改進算法
2.5.1 二叉樹判定算法
2.5.2 按信息比值進行估計的方法
2.5.3 按分類信息估值
2.5.4 按劃分距離估值的方法
2.6 決策樹的評價
2.7 簡化決策樹
2.7.1 簡化決策樹的動機
2.7.2 決策樹過大的原因
2.7.3 控制樹的大小
2.7.4 修改測試屬性空間
2.7.5 改進測試屬性選擇方法
2.7.6 對數(shù)據(jù)進行限制
2.7.7 改變數(shù)據(jù)結構
2.8 連續(xù)型屬性離散化
2.9 基于偏置變換的決策樹學習算法BSDT
2.9.1 偏置的形式化
2.9.2 表示偏置變換
2.9.3 算法描述
2.9.4 過程偏置變換
2.9.5 基于偏置變換的決策樹學習算法BSDT
2.9.6 經典范例庫維護算法TCBM
2.9.7 偏置特征抽取算法
2.9.8 改進的決策樹生成算法GSD
2.9.9 實驗結果
2.10 歸納學習中的問題
第3章關聯(lián)規(guī)則
3.1 關聯(lián)規(guī)則挖掘概述
3.1.1 關聯(lián)規(guī)則的意義和度量
3.1.2 經典的挖掘算法
3.2 廣義模糊關聯(lián)規(guī)則的挖掘
3.3 挖掘關聯(lián)規(guī)則的數(shù)組方法
3.4 任意多表間關聯(lián)規(guī)則的并行挖掘
3.4.1 問題的形式描述
3.4.2 單表內大項集的并行計算
3.4.3 任意多表間大項集的生成
3.4.4 跨表間關聯(lián)規(guī)則的提取
3.5 基于分布式系統(tǒng)的關聯(lián)規(guī)則挖掘算法
3.5.1 候選集的生成
3.5.2 候選數(shù)據(jù)集的局部剪枝
3.5.3 候選數(shù)據(jù)集的全局剪枝
3.5.4 合計數(shù)輪流檢測
3.5.5 分布式挖掘關聯(lián)規(guī)則的算法
3.6 詞性標注規(guī)則的挖掘算法與應用
3.6.1 漢語詞性標注
3.6.2 問題的描述
3.6.3 挖掘算法
3.6.4 試驗結果
第4章基于范例的推理
4.1 概述
4.2 過程模型
4.3 范例的表示
4.3.1 語義記憶單元
4.3.2 記憶網
4.4 范例的索引
4.5 范例的檢索
4.6 相似性關系
4.6.1 語義相似性
4.6.2 結構相似性
4.6.3 目標特征
4.6.4 個體相似性
4.6.5 相似性計算
4.7 范例的復用
4.8 范例的保存
4.9 基于例示的學習
4.9.1 基于例示學習的任務
4.9.2 IB1算法
4.9.3 降低存儲要求
4.10 范例工程
4.11 范例約簡算法
4.12 中心漁場預報專家系統(tǒng)
4.12.1 問題分析與范例表示
4.12.2 相似性度量
4.12.3 索引與檢索
4.12.4 基于框架的修正
4.12.5 實驗結果
第5章模糊聚類
5.1 概述
5.1.1 聚類結果的表示
5.1.2 模糊聚類的一般模型
5.2 傳遞閉包法
5.2.1 模糊相似系數(shù)的標定
5.2.2 傳遞閉包法
5.2.3 動態(tài)直接聚類法
5.2.4 最大樹法
5.3 FCMBP聚類法
5.3.1 問題背景
5.3.2 Fuzzy等價標準型
5.3.3 置換等價類與平移等價類的記數(shù)公式
5.3.4 Xn的結構
5.3.5 模糊最優(yōu)等價陣的存在性
5.3.6 最優(yōu)模糊等價陣的算法步驟
5.3.7 基于FCMBP模糊聚類的語音識別
5.4 系統(tǒng)聚類法
5.5 C－均值聚類法
5.6 聚類有效性
5.7 聚類方法的比較
第6章粗糙集
6.1 概述
6.1.1 知識的分類觀點
6.1.2 新型的隸屬關系
6.1.3 概念的邊界觀點
6.2 知識的約簡
6.2.1 一般約簡
6.2.2 相對約簡
6.2.3 知識的依賴性
6.3 決策邏輯
6.3.1 決策表的公式化定義
6.3.2 決策邏輯語言
6.3.3 決策邏輯語言的語義
6.3.4 決策邏輯的推演
6.3.5 規(guī)范表達形式
6.3.6 決策規(guī)則和決策算法
6.3.7 決策規(guī)則中的一致性和不分明性
6.4 決策表的約簡
6.4.1 屬性的依賴性
6.4.2 一致決策表的約簡
6.4.3 非一致決策表的約簡
6.5 粗糙集的擴展模型
6.5.1 可變精度粗糙集模型
6.5.2 相似模型
6.5.3 基于粗糙集的非單調邏輯
6.5.4 與其他數(shù)學工具的結合
6.6 粗糙集的實驗系統(tǒng)
6.7 粗糙集的展望
第7章貝葉斯網絡
7.1 概述
7.1.1 貝葉斯網絡的發(fā)展歷史
7.1.2 貝葉斯方法的基本觀點
7.1.3 貝葉斯網絡在數(shù)據(jù)挖掘中的應用
7.2 貝葉斯概率基礎
7.2.1 概率論基礎
7.2.2 貝葉斯概率
7.3 貝葉斯學習理論
7.3.1 幾種常用的先驗分布選取方法
7.3.2 計算學習機制
7.3.3 貝葉斯問題求解
7.4 簡單貝葉斯學習模型
7.4.1 簡單貝葉斯學習模型
7.4.2 簡單貝葉斯模型的提升
7.4.3 提升簡單貝葉斯分類的計算復雜性
7.5 貝葉斯網絡的建造
7.5.1 貝葉斯網絡的結構及建立方法
7.5.2 學習貝葉斯網絡的概率分布
7.5.3 學習貝葉斯網絡的網絡結構
7.6 貝葉斯?jié)撛谡Z義模型
7.7 半監(jiān)督文本挖掘算法
7.7.1 網頁聚類
7.7.2 對含有潛在類別主題詞的文檔的類別標注
7.7.3 基于簡單貝葉斯模型學習標注和未標注樣本
第8章支持向量機
8.1 統(tǒng)計學習問題
8.1.1 經驗風險
8.1.2 VC維
8.2 學習過程的一致性
8.2.1 學習一致性的經典定義
8.2.2 學習理論的重要定理
8.2.3 VC熵
8.3 結構風險最小歸納原理
8.4 支持向量機
8.4.1 線性可分
8.4.2 線性不可分
8.5 核函數(shù)
8.5.1 多項式核函數(shù)
8.5.2 徑向基函數(shù)
8.5.3 多層感知機
8.5.4 動態(tài)核函數(shù)
8.6 基于分類超曲面的海量數(shù)據(jù)分類方法
8.6.1 Jordan曲線定理
8.6.2 SVM直接方法基本思想
8.6.3 實現(xiàn)算法
8.6.4 實驗結果分析
第9章隱馬爾科夫模型
9.1 馬爾科夫過程
9.2 隱馬爾科夫模型
9.3 似然概率和前反向算法
9.3.1 前向算法
9.3.2 反向算法
9.3.3 Viterbi算法
9.3.4 計算期望
9.4 學習算法
9.4.1 EM算法
9.4.2 梯度下降
9.4.3 Viterbi學習
9.5 基于狀態(tài)駐留時間的分段概率模型
9.5.1 SDSPM模型的構成
第10章神經網絡
10.1 概述
10.1.1 基本的神經網絡模型
10.1.2 神經網絡的學習方法
10.2 人工神經元及感知機模型
10.2.1 基本神經元
10.2.2 感知機模型
10.3 前向神經網絡
10.3.1 前向神經網絡模型
10.3.2 多層前向神經網絡的誤差反向傳播（BP）算法
10.3.3 BP算法的若干改進
10.4 徑向基函數(shù)神經網絡
10.4.1 插值問題
10.4.2 正規(guī)化問題
10.4.3 RBF網絡學習方法
10.5 反饋神經網絡
10.5.1 離散Hopfield網絡
10.5.2 連續(xù)Hopfield網絡
10.5.3 Hopfield網絡應用
10.5.4 雙向聯(lián)想記憶模型
10.6 隨機神經網絡
10.6.1 模擬退火算法
10.6.2 玻爾茲曼機
10.7 自組織特征映射神經網絡
10.7.1 網絡的拓撲結構
10.7.2 網絡自組織算法
10.7.3 有教師學習
第11章進化和遺傳算法
11.1 概述
11.2 基本遺傳算法
11.2.1 基本遺傳算法的構成要素
11.2.2 基本遺傳算法的一般框架
11.3 遺傳算法的數(shù)學理論
11.3.1 模式定理
11.3.2 積木塊假設
11.3.3 遺傳算法欺騙問題
11.3.4 隱并行性
11.4 遺傳算法的基本實現(xiàn)技術
11.4.1 編碼方法
11.4.2 適應度函數(shù)
11.4.3 選擇算子
11.4.4 交叉算子
11.4.5 變異算子
11.4.6 約束條件的處理方法
11.5 遺傳算法的高級實現(xiàn)技術
11.5.1 反轉操作
11.5.2 變長度染色體遺傳算法
11.5.3 小生境遺傳算法
11.5.4 混合遺傳算法
11.5.5 改進遺傳算法
11.6 并行遺傳算法
11.7 遺傳算法應用
11.7.1 優(yōu)化神經網絡連接權值
11.7.2 用遺傳算法優(yōu)化神經網絡連接結構
第12章知識發(fā)現(xiàn)平臺MSMiner
12.1 概述
12.2 數(shù)據(jù)倉庫
12.2.1 數(shù)據(jù)倉庫含義
12.2.2 元數(shù)據(jù)
12.2.3 OLAP
12.2.4 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的結合
12.3 MSMiner的體系結構
12.3.1 數(shù)據(jù)挖掘模型
12.3.2 系統(tǒng)功能
12.3.3 體系結構
12.4 元數(shù)據(jù)管理
12.4.1 MSMiner元數(shù)據(jù)的內容
12.4.2 MSMiner元數(shù)據(jù)庫
12.4.3 MSMiner元數(shù)據(jù)對象模型
12.5 數(shù)據(jù)倉庫管理器
12.5.1 MSMiner數(shù)據(jù)倉庫的基本結構
12.5 2 主題
12.5.3 數(shù)據(jù)抽取和集成
12.5.4 數(shù)據(jù)抽取和集成的元數(shù)據(jù)
12.5.5 數(shù)據(jù)倉庫建模及OLAP的實現(xiàn)
12.6 算法庫管理
12.6.1 數(shù)據(jù)挖掘算法的元數(shù)據(jù)
12.6.2 可擴展性的實現(xiàn)
12.6.3 挖掘算法的接口規(guī)范
12.7 數(shù)據(jù)挖掘任務規(guī)劃
12.7.1 面向對象的數(shù)據(jù)挖掘任務模型
12.7.2 數(shù)據(jù)挖掘任務模型的處理
12.8 關系數(shù)據(jù)庫知識發(fā)現(xiàn)查詢語言KDSQI
12.8.1 知識對象
12.8.2 知識發(fā)現(xiàn)查詢語言定義
12.8.3 擴充的CREATE命令語句
12.8.4 擴充的SELECT命令語句
第13章 Web知識發(fā)現(xiàn)
13.1 概述
13.2 Web知識發(fā)現(xiàn)的任務
13.2.1 Web知識發(fā)現(xiàn)任務的分類
13.2.2 Web內容發(fā)現(xiàn)
13.2.3 Web結構挖掘
13.3 Web知識發(fā)現(xiàn)方法
13.3.1 文本的特征表示
13.3.2 TFIDF向量表示法
13.3.3 特征子集的選取
13.4 模型質量評價
13.5 文本分析功能
13.5.1 名字提取
13.5.2 術語提取
13.5.3 縮寫詞識別器
13.5.4 其他提取器
13.6 文本特征的提取
13.6.1 一般特征項的提取
13.6.2 專有特征項的提取
13.7 基于文本挖掘的漢語詞性自動標注研究
13.8 文本分類
13.9 文本聚類
13.9.1 層次凝聚法
13.9.2 平面劃分法
13.9.3 簡單貝葉斯聚類算法
13.9.4 k－最近鄰參照聚類算法
13.9.5 分級聚類
13.9.6 基于概念的文本聚類
13.10 文本摘要
13.11 用戶興趣挖掘
第14章生物信息知識發(fā)現(xiàn)
14.1 概述
14.2 基因的基本結構
14.3 生物信息數(shù)據(jù)庫與查詢
14.3.1 基因和基因組數(shù)據(jù)庫
14.3.2 蛋白質數(shù)據(jù)庫
14.3.3 功能數(shù)據(jù)庫
14.4 序列比對
14.4.1 序列兩兩比對
14.4.2 多序列比對
14.5 核酸與蛋白質結構和功能的預測分析
14.5.1 核酸序列的預測方法
14.5.2 針對蛋白質的預測方法
14.6 基因組序列信息分析
14.7 功能基因組相關信息分析
14.7.1 大規(guī)?；虮磉_譜分析
14.7.2 基因組水平蛋白質功能綜合預測
14.8 Internet資源和公共數(shù)據(jù)庫
參考文獻
索引