目錄
第一章 概述
1.1文檔數(shù)據(jù)庫
1.2文檔壓縮
1.3索引
1.4文檔圖像
1.5海量文檔管理系統(tǒng)
1.6進一步閱讀
第二章 文本壓縮
2.1模型
2.2自適應模型
2.3編碼
2.4符號模型
2.5字典模型
2.6同步
2.7性能比較
2.8進一步閱讀
第三章 索引
3.1樣本文檔集合
3.2倒置文件索引
3.3倒置文件壓縮
3.4索引壓縮方法性能
3.5署名文件和位圖
3.6字體轉換及詞根化和無用詞
3.7索引方法比較
3.8進一步閱讀
第四章 查詢
4.1詞典訪問
4.2部分指定查詢術語
4.3布爾查詢處理
4.4排列及信息檢索
4.5檢索有效性估算
4.6余弦法的實現(xiàn)
4.7交互式檢索
4.8進一步閱讀
第五章 索引構造
5.1基于內存的倒置
5.2基于排序分類的倒置
5.3使用索引壓縮
5.4壓縮內存中倒置
5.5索引方法的對比
5.6構造署名文件和位圖
5.7動態(tài)集合
5.8進一步閱讀
第六章 圖像壓縮
6.1圖像類型
6.2二值圖像的CCITT傳真標準
6.3基于上下文的二值圖像壓縮
6.4JBIG:二值圖像的標準
6.5JPEG:連續(xù)色調圖像的標準
6.6灰度圖像的無損壓縮
6.7圖像的遞增傳輸
6.8圖像壓縮技術小結
6.9進一步閱讀
第七章 文本圖像
7.1文本圖像壓縮的概念
7.2有損及無損壓縮
7.3標志提取
7.4模板匹配
7.5從標志到符號
7.6對文本圖像的成分進行編碼
7.7性能:有損及無損模式
7.8對系統(tǒng)的考慮
7.9進一步閱讀
第八章 混合圖文
8.1確定方向
8.2分割
8.3分類
8.4進一步閱讀
第九章 實現(xiàn)
9.1文本壓縮
9.2文本壓縮性能
9.3圖像和文本圖像
9.4索引構造
9.5索引壓縮
9.6查詢處理
9.7進一步閱讀
第十章 信息爆炸
10.1信息技術發(fā)展兩千年
10.2Internet:一種全球信息資源
10.3紙張問題
10.4面對信息爆炸
10.5使海量數(shù)據(jù)管理更好
10.6對生活的個人信息支持
10.7進一步閱讀
附錄A mg系統(tǒng)指南
A.1mg系統(tǒng)安裝
A.2存儲和檢索的例子
A.3數(shù)據(jù)庫生成
A.4查詢一個索引后的文件集
A.5非文本文件
A.6圖像壓縮程序
詞匯表