第1章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究內容框架
1.4 本書章節(jié)安排
第2章 相關研究工作綜述
2.1 雙語語料采集研究綜述
2.1.1 基于網絡資源的可比語料采集
2.1.2 基于平行網頁的平行語料采集
2.2 可比語料評估研究綜述
2.2.1 可比語料的可比度度量
2.2.2 跨語言文檔相似度計算
2.3 多語言文本關鍵詞抽取研究綜述
2.3.1 候選關鍵詞的選取
2.3.2 有監(jiān)督的關鍵詞抽取方法
2.3.3 無監(jiān)督的關鍵詞抽取方法
2.4 多語言文本聚類研究綜述
2.4.1 文本表示模型
2.4.2 文本聚類算法
2.4.3 多語言文本聚類
第3章 雙語語料采集與構建研究
3.1 雙語平行網頁發(fā)現
3.1.1 總體流程與關鍵技術
3.1.2 網頁結果評估與分析
3.2 雙語可比語料構建
3.2.1 總體流程與關鍵技術
3.2.2 可比語料構建結果與分析
3.3 本章小結
第4章 雙語可比語料評估研究
4.1 可比語料可比度度量
4.1.1 總體流程與關鍵技術
4.1.2 可比度度量結果與分析
4.2 可比語料的評估
4.2.1 總體流程與關鍵技術
4.2.2 語料評估結果與分析
4.3 本章小結
第5章 雙語文本關鍵詞挖掘研究
5.1 關鍵詞分布特點分析
5.1.1 中文關鍵詞分布特點分析
5.1.2 英文關鍵詞分布特點分析
5.2 關鍵詞抽取方法思路與關鍵技術
5.2.1 關鍵詞抽取總體流程
5.2.2 關鍵詞抽取中的特征計算方法
5.3 實驗與結果分析
5.3.1 特征歸一化與結果評價
5.3.2 中文關鍵詞抽取實驗結果
5.3.3 英文關鍵詞抽取實驗結果
5.4 本章小結
第6章 雙語文本聚類研究
6.1 平行語料聚類研究
6.1.1 平行語料聚類的總體流程
6.1.2 中英文平行語料聚類的關鍵技術
6.1.3 文本聚類結果與分析
6.2 可比語料聚類研究
6.2.1 可比語料聚類的總體流程
6.2.2 中英文可比語料聚類的關鍵技術
6.2.3 文本聚類結果與分析
6.3 本章小結
第7章 結束語
7.1 總結
7.2 未來研究工作
7.2.1 雙語語料采集與構建
7.2.2 雙語可比語料評估
7.2.3 雙語文本關鍵詞抽取與雙語文本聚類
附錄
附錄A 基于搜索引擎方法采集可比語料的種子詞對示例
附錄B Wikipedia可比語料采集種子詞樣例
附錄C Wikipedia可比語料中的對齊標題(部分)
附錄D 圖情核心期刊在CNKI(19982011)中的檢索結果
附錄E 圖書情報期刊在EBSCO數據庫中檢索和下載情況
附錄F 基于傳統(tǒng)統(tǒng)計和詞頻統(tǒng)計的語料相似度結果
附錄G 基于術語度的可比語料與其他領域語料比較結果
參考文獻
索引