注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數據庫數據庫挖掘/數據倉庫數據倉庫(原書第4版)

數據倉庫(原書第4版)

數據倉庫(原書第4版)

定 價:¥39.00

作 者: (美)蔭蒙(Inmon,W.H) 著,王志海 等譯
出版社: 機械工業(yè)出版社
叢編項: 計算機科學叢書
標 簽: 數據庫存儲與管理

ISBN: 9787111191940 出版時間: 2006-08-01 包裝: 膠版紙
開本: 16開 頁數: 311 字數:  

內容簡介

  本書系統(tǒng)講述數據倉庫的基本概念、基本原理以及建立數據倉庫的方法和過程。主要內容包括:決策支持系統(tǒng)的發(fā)展、數據倉庫環(huán)境結構、數據倉庫設計、數據倉庫粒度劃分、數據倉庫技術、分布式數據倉庫、EIS系統(tǒng)和數據倉庫的關系、外部和非結構化數據與數據倉庫的關系、數據裝載問題、數據倉庫與Web、ERP與數據倉庫以及數據倉庫設計的復查要目。.本書是數據倉庫之父撰寫的關于數據倉庫的最權威著作,既可作為相關專業(yè)的研究生教材,也是數據倉庫的研究、開發(fā)和管理人員的必備指南。數據倉庫為企業(yè)和組織提供了收集、存儲和分析海量業(yè)務數據的必要策略。隨著業(yè)務活動的日益增長,數據倉庫領域變得越來越重要。本書被譽為數據倉庫的“圣經”,從1990年第1版出版起,不僅帶動了數據倉庫行業(yè)的發(fā)展,而且至今仍然是數據倉庫方面的優(yōu)秀入門讀物。第4版涵蓋了數據倉庫最新技術,保持了在這一領域的先鋒地位。..縱觀數據倉庫系統(tǒng)的基本組成部分,讀者會體驗到數據倉庫設計方法的更新;各種數據倉庫的遷移策略以及應用在裝載、索引和數據管理方面的技術。本書為讀者提供了數據倉庫領域的最新進展。本書新增的內容:在數據倉庫中處理非結構化數據的方法在各種不同的存儲介質上存儲數據的方法關系型數據庫設計和多維數據庫設計的對比在規(guī)劃數據倉庫項目時如何度量投資回報探索更高級的研究主題,包括數據的監(jiān)控與測試...

作者簡介

  本書提供作譯者介紹William H. Inmon是世界公認的“數據倉庫之父”,是數據倉庫及其相關技術網站www.billinmon.com的合作伙伴,是“企業(yè)信息工廠”的創(chuàng)造者之一。他一直致力于數據庫和數據倉庫技術方面的研究,在數據管理和數據倉庫技術方面以及數據處理的管理方面撰寫了40多本著作,發(fā)表過600多篇學術論文,并且經常應邀在技術和學術會議上演講。.王志海,博士,副教授,1963年10月出生,1985年畢業(yè)于鄭州大學計算機科學系,獲理學學士學位,1987年畢業(yè)于哈爾濱船舶工程學院計算機與信息科學系,獲工...

圖書目錄

第1章 決策支持系統(tǒng)的發(fā)展        1
1.1 演化        1
1.1.1 直接存取存儲設備的出現(xiàn)        2
1.1.2 個人計算機/第四代編程語言技術        3
1.1.3 進入抽取程序        3
1.1.4 蜘蛛網        4
1.2 自然演化式體系結構的問題        4
1.2.1 數據缺乏可信性        5
1.2.2 生產率問題        6
1.2.3 從數據到信息        8
1.2.4 方法的變遷        9
1.2.5 體系結構化環(huán)境        11
1.2.6 體系結構化環(huán)境中的數據集成        12
1.2.7 用戶是誰        13
1.3 開發(fā)生命周期        14
1.4 硬件利用模式        15
1.5 為重建工程創(chuàng)造條件        15
1.6 監(jiān)控數據倉庫環(huán)境        17
1.7 小結        19
第2章 數據倉庫環(huán)境        20
2.1 數據倉庫的結構        23
2.2 面向主題        23
2.3 第1天到第n天的現(xiàn)象        26
2.4 粒度        28
2.4.1 粒度帶來的好處        29
2.4.2 粒度的一個例子        29
2.4.3 雙重粒度        31
2.5 探查與數據挖掘        34
2.6 活樣本數據庫        34
2.7 分區(qū)設計方法        35
2.8 數據倉庫中的數據組織        38
2.9 審計與數據倉庫        41
2.10 數據的同構/異構        41
2.11 數據倉庫中的數據清理        42
2.12 報表與體系結構化環(huán)境        43
2.13 各種環(huán)境中的操作型窗口        43
2.14 數據倉庫中的錯誤數據        45
2.15 小結        45
第3章 設計數據倉庫        47
3.1 從操作型數據開始        47
3.2 數據/過程模型與體系結構化環(huán)境        51
3.3 數據倉庫與數據模型        52
3.3.1 數據倉庫的數據模 ?54
3.3.2 中間層數據模型        54
3.3.3 物理數據模型        59
3.4 數據模型與迭代式開發(fā)        60
3.5 規(guī)范化/反向規(guī)范化        61
3.6 元數據        67
3.7 數據周期—時間間隔        69
3.8 轉換和集成的復雜性        70
3.9 數據倉庫記錄的觸發(fā)        73
3.9.1 事件        73
3.9.2 快照的構成        73
3.9.3 一些例子        74
3.10 概要記錄        74
3.11 管理大量數據        75
3.12 創(chuàng)建多個概要記錄        76
3.13 從數據倉庫環(huán)境到操作型環(huán)境        76
3.14 數據倉庫數據的直接操作型訪問        77
3.15 數據倉庫數據的間接訪問        77
3.15.1 航空公司的傭金計算系統(tǒng)        78
3.15.2 零售個性化系統(tǒng)        79
3.15.3 信用審核        80
3.16 數據倉庫數據的間接使用        81
3.17 星形連接        82
3.18 支持操作型數據存儲        86
3.19 需求和Zachman框架        87
3.20 小結        88
第4章 數據倉庫中的粒度        90
4.1 粗略估算        90
4.2 規(guī)劃過程的輸入        91
4.3 溢出存儲器中的數據        92
4.4 確定粒度級別        95
4.5 一些反饋循環(huán)技巧        96
4.6 確定粒度級別的幾個例子        97
4.6.1 銀行環(huán)境中的粒度級別        97
4.6.2 制造業(yè)環(huán)境中的粒度級別        99
4.6.3 保險業(yè)環(huán)境中的粒度級別        100
4.7 填充數據集市        102
4.8 小結        102
第5章  數據倉庫和技術        103
5.1 管理大量數據        103
5.2 管理多種介質        104
5.3 索引和監(jiān)控數據        104
5.4 多種技術的接口        105
5.5 程序員/設計者對數據存放位置的控制        105
5.6 數據的并行存儲和管理        105
5.7 語言接口        107
5.8 數據的有效裝載        107
5.9 有效利用索引        108
5.10 數據壓縮        108
5.11 復合主鍵        109
5.12 變長數據        109
5.13 加鎖管理        110
5.14 只涉及索引的處理        110
5.15 快速恢復        110
5.16 其他的技術特征        110
5.17  DBMS類型和數據倉庫        111
5.18 改變DBMS技術        112
5.19 多維DBMS和數據倉庫        112
5.20 在多種存儲介質上構建數據倉庫        117
5.21 數據倉庫環(huán)境中元數據的角色        117
5.22 上下文和內容        119
5.22.1 上下文信息的三種類型        119
5.22.2 捕獲和管理上下文信息        120
5.22.3 回顧上下文信息管理歷史        121
5.23 刷新數據倉庫        121
5.24 測試問題        122
5.25 小結        123
第6章 分布式數據倉庫        124
6.1 分布式數據倉庫的類型        124
6.1.1 局部數據倉庫和全局數據倉庫        124
6.1.2 技術分布式數據倉庫        135
6.1.3 獨立開發(fā)的分布式數據倉庫        136
6.2 開發(fā)項目的本質特征        136
6.3 分布式數據倉庫的開發(fā)        139
6.3.1 在分布的地理位置間協(xié)調開發(fā)        140
6.3.2 企業(yè)數據的分布式模型        141
6.3.3 分布式數據倉庫中的元數據        142
6.4 在多種層次上構建數據倉庫        142
6.5 多個小組建立當前細節(jié)級        144
6.5.1 不同層的不同需求        146
6.5.2 其他類型的細節(jié)數據        148
6.5.3 元數據        148
6.6 公共細節(jié)數據采用多種平臺        150
6.7 小結        150
第7章 主管信息系統(tǒng)和數據倉庫        152
7.1 EIS概述        152
7.2 一個簡單例子        152
7.3 向下鉆取分析        154
7.4 支持向下鉆取處理        156
7.5 作為EIS基礎的數據倉庫        156
7.6 到哪里取數據        158
7.7 事件映射        159
7.8 細節(jié)數據和EIS        160
7.9 在EIS中只保存匯總數據        161
7.10  小結        162
第8章 外部數據與數據倉庫        163
8.1 數據倉庫中的外部數據        164
8.2 元數據和外部數據        165
8.3 存儲外部數據        167
8.4 外部數據的不同部件        167
8.5 建模與外部數據        168
8.6 輔助報告        168
8.7 外部數據存檔        169
8.8 內部數據與外部數據的比較        169
8.9 小結        169
第9章 遷移到體系結構化環(huán)境        171
9.1 一種遷移方案        171
9.2 反饋循環(huán)        176
9.3 策略方面的考慮        177
9.4 方法和遷移        179
9.5 數據驅動的開發(fā)方法        180
9.5.1 概念        181
9.5.2 系統(tǒng)開發(fā)生命周期        181
9.5.3 智者觀點        182
9.6 小結        182
第10章 數據倉庫和Web        183
10.1 支持電子商務環(huán)境        189
10.2 將數據從Web移動到數據倉庫        190
10.3 將數據從數據倉庫移動到Web        190
10.4 對Web的支持        190
10.5 小結        191
第11章 非結構化數據和數據倉庫        192
11.1 兩個領域的集成        193
11.1.1 文本—公共聯(lián)接        193
11.1.2 基本錯誤匹配        195
11.1.3 環(huán)境間文本匹配        195
11.1.4 概率匹配        195
11.1.5 匹配所有信息        196
11.2 主題匹配        197
11.2.1 產業(yè)特征主題        197
11.2.2 自然事件主題        199
11.2.3 通過主題和主題詞關聯(lián)        200
11.2.4 通過抽象和元數據關聯(lián)        200
11.3 兩層數據倉庫        201
11.3.1 非結構化數據倉庫分類        202
11.3.2 非結構化數據倉庫中的文檔        203
11.3.3 非結構化數據可視化        203
11.4 自組織圖(SOM)        204
11.4.1 非結構化數據倉庫        205
11.4.2 數據量和非結構化數據倉庫        205
11.5 適用于兩個環(huán)境        206
11.6 小結        207
第12章 大型數據倉庫        208
12.1 快速增長的原因        208
12.2 龐大數據量的影響        209
12.2.1 基本數據管理活動        209
12.2.2 存儲費用        210
12.2.3 實際存儲費用        210
12.2.4 大型數據量中的數據使用模式        211
12.2.5 一個簡單計算        211
12.2.6 兩類數據        212
12.2.7 數據分類涉及的問題        212
12.3 數據在不同介質的存儲        213
12.3.1 近線存儲        213
12.3.2 訪問速度和磁盤存儲        214
12.3.3 存檔存儲        215
12.3.4 透明的意義        216
12.4 環(huán)境間數據轉移        216
12.4.1 CMSM方法        217
12.4.2 數據倉庫使用監(jiān)控器        218
12.4.3 不同存儲介質下數據倉庫的擴展        218
12.5 數據倉庫轉換        219
12.6 總費用        219
12.7 最大容量        219
12.8 小結        220
第13章 關系模型和多維模型數據庫 設計基礎        222
13.1 關系模型        222
13.2 多維模型        223
13.3 雪花結構        224
13.4 兩種模型的區(qū)別        224
13.4.1 區(qū)別的起源        225
13.4.2 重建關系型數據        225
13.4.3 數據的直接訪問和間接訪問        226
13.4.4 支持將來未知的需求        227
13.4.5 支持適度變化的需求        227
13.5 獨立數據集市        229
13.6 建立獨立數據集市        230
13.7 小結        232
第14章 數據倉庫高級話題        233
14.1 最終用戶的需求和數據倉庫        233
14.1.1 數據倉庫和數據模型        233
14.1.2 關系型的基礎        233
14.1.3 數據倉庫和統(tǒng)計處理        234
14.2 數據倉庫內的資源競爭        234
14.2.1 探查型數據倉庫        235
14.2.2 數據挖掘型數據倉庫        236
14.2.3 凍結探查型數據倉庫        236
14.2.4 外部數據和探查型數據倉庫        237
14.3 同一個處理器處理數據集市和 數據倉庫        237
14.4 數據的生命周期        238
14.5 測試和數據倉庫        239
14.6 追蹤數據倉庫中的數據流        240
14.6.1 數據倉庫中的數據速率        241
14.6.2 “推”和“拉”數據        242
14.7 數據倉庫和基于網絡的電子商務環(huán)境        242
14.7.1 兩種環(huán)境之間的界面        242
14.7.2 粒度管理器        243
14.7.3 概要記錄        244
14.7.4 ODS,概要記錄以及性能        244
14.8 財務數據倉庫        245
14.9 記錄系統(tǒng)        246
14.10 結構體系的概要歷史—演化 為公司信息工廠        247
14.10.1 CIF的進化        249
14.10.2 障礙        249
14.11 CIF的未來        250
14.11.1 分析        250
14.11.2 ERP/SAP        250
14.11.3 非結構化數據        251
14.11.4 數據量        251
14.12 小結        252
第15章 數據倉庫的成本論證和 投資回報        254
15.1 應對競爭        254
15.2 宏觀上的成本論證        254
15.3 微觀上的成本論證        255
15.4 來自遺留環(huán)境的信息        256
15.4.1 新信息的成本        257
15.4.2 用數據倉庫收集信息        257
15.4.3 成本比較        257
15.4.4 建立數據倉庫        257
15.4.5 完整的情況圖        258
15.4.6 得到數據的障礙        258
15.5 數據的時間價值        259
15.6 集成的信息        260
15.6.1 歷史數據的價值        261
15.6.2 歷史數據和客戶關系模型        261
15.7 小結        261
第16章 數據倉庫和ODS        263
16.1 互補的結構        263
16.1.1 ODS中的升級        264
16.1.2 歷史數據與ODS        264
16.1.3 概要記錄        264
16.2 不同種類的ODS        265
16.3 數據庫設計—一種混合的方式        266
16.4 按比例畫圖        266
16.5 ODS中的事務集成        267
16.6 對ODS處理日進行分片        267
16.7 多個ODS        267
16.8 ODS和網絡環(huán)境        268
16.9 ODS的一個例子        268
16.10 小結        269
第17章 企業(yè)信息依從準則和數據倉庫        270
17.1 兩個基本行為        270
17.2 財務依從準則        270
17.2.1 “是什么”        272
17.2.2 “為什么”        273
17.3 審計公司的交流信息        274
17.4 小結        276
第18章 最終用戶社區(qū)        277
18.1 農民        277
18.2 探險者        277
18.3 礦工        277
18.4 旅行者        278
18.5 整個社區(qū)        278
18.6 不同的數據類型        278
18.7 成本論證和ROI分析        278
18.8 小結        279
第19章 數據倉庫設計的復查要目        280
19.1 何時進行設計復查        280
19.2 誰負責設計復查        281
19.3 有哪些議事日程        281
19.4 結果        281
19.5 復查管理        281
19.6 典型的數據倉庫設計復查        282
19.7 小結        295
術語表        296
參考文獻        305

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號