目錄
序
第一章 緒論 1
第一節(jié) 中文信息處理概述 1
一、什么是中文信息處理 1
二、研究中文信息處理的意義 3
第二節(jié) 中文信息處理的內容 5
一、中文信息處理的研究范圍 5
二、中文信息處理的研究方法 6
三、常見的應用系統(tǒng) 8
第三節(jié) 中文信息處理研究的格局 10
一、中文信息處理與相關學科的關系 10
二、中文信息處理的研究取向 11
三、中文信息處理研究的基本歷史分期 13
參考文獻 14
第二章 中文信息處理的起步期 16
第一節(jié) 中文信息處理問題的誕生背景及萌芽 16
一、自然語言處理的理論準備 16
二、自然語言處理的發(fā)端 18
三、中文信息處理的萌芽 19
第二節(jié) 中文信息處理問題的興起 22
一、沉寂后的復蘇 22
二、漢字信息處理時代的到來 24
三、漢字精密照排系統(tǒng)的發(fā)展 27
第三節(jié) 漢字編碼工作的開展 28
一、漢字編碼的基本任務 28
二、字頻統(tǒng)計工作的展開 30
三、萬“碼”奔騰時代的到來 32
四、漢字交換碼標準的編制及發(fā)展 34
五、漢字編碼的國際標準 37
第四節(jié) 漢字的輸入及輸出技術 38
一、鍵盤輸入技術 38
二、漢字自動識別輸入 44
三、漢語語音識別輸入 47
四、漢字的存儲及輸出技術 50
第五節(jié) 起步期的應用研究及理論探索 55
一、從機器翻譯到自然語言理解 55
二、自然語言理解與人機對話 59
三、信息檢索及相關技術 61
四、學會組織的建立與發(fā)展 63
第六節(jié) 小結 65
參考文獻 66
第三章 中文信息處理的發(fā)展期 70
第一節(jié) “詞”處理時代的到來 70
一、“詞”處理的基本任務 70
二、詞頻統(tǒng)計與詞表編制 72
第二節(jié) 語料庫的發(fā)展與建設 74
一、統(tǒng)計方法的復蘇與語料庫的發(fā)展 74
二、我國的早期語料庫建設 77
第三節(jié) 自動分詞技術的發(fā)展 78
一、自動分詞的困境 78
二、自動分詞方法的探索 80
三、歧義與未登錄詞 85
四、自動分詞系統(tǒng)的研制 89
五、分詞規(guī)范的編訂 91
六、自動分詞技術的評測 93
第四節(jié) 詞性標注技術的發(fā)展 95
一、詞性標注與詞類劃分 95
二、詞性標注中的兼類詞難題 99
三、詞性標注技術的發(fā)展 101
第五節(jié) 語音處理技術的突破 103
一、隱馬爾可夫模型 103
二、語音識別技術的新進展 104
三、語音合成技術 105
第六節(jié) 應用研究的發(fā)展 109
一、“語言工程”概念的提出 109
二、機器翻譯的新發(fā)展 110
三、計算機輔助語言教學與測試 112
第七節(jié) 小結 114
參考文獻 115
第四章 中文信息處理的成熟期 119
第一節(jié) 成熟期的基本格局 119
一、統(tǒng)計方法的回歸 119
二、從“詞”處理到“句”處理 123
三、“句”處理的主要困難 125
第二節(jié) 句法分析與語義分析 127
一、句法、語義分析技術的發(fā)展背景 127
二、句法分析理論的兩大體系 130
三、漢語句法分析方法的探索 134
四、語義資源及語義分析理論的發(fā)展 138
五、語義消歧與語義標注 142
第三節(jié) 基礎資源庫建設 147
一、語料庫迅猛發(fā)展 147
二、大規(guī)模語言知識庫建設 149
第四節(jié) 應用型技術及相關研究 158
一、機器翻譯 158
二、網絡技術下的新動向 161
第五節(jié) 小結 165
參考文獻 167
第五章 中文信息處理的繁榮期 171
第一節(jié) 研究范式的徹底轉向 171
一、從人工神經網絡到深度學習 171
二、人工智能與大數據 173
三、語音識別技術的突飛猛進 176
第二節(jié) 新時期的中文信息處理 178
一、中文信息處理的新特點 178
二、基于深度學習的中文信息處理研究 180
三、新研究領域的拓展 184
四、應用型技術的百花齊放 186
第三節(jié) 深度學習語境下的新挑戰(zhàn) 189
一、語言學知識有待回歸 189
二、進一步拓展與深化新的應用領域 191
三、與認知科學及腦神經科學相結合 194
四、走向多模態(tài)信息處理 197
五、深入國際交流與合作 201
第四節(jié) 小結 203
參考文獻 205
后記 207