注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能圖解語(yǔ)音識(shí)別

圖解語(yǔ)音識(shí)別

圖解語(yǔ)音識(shí)別

定 價(jià):¥59.00

作 者: [日] 荒木雅弘 著,陳舒揚(yáng),楊文剛 譯
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787115528711 出版時(shí)間: 2020-04-01 包裝: 平裝
開(kāi)本: 大32開(kāi) 頁(yè)數(shù): 191 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《圖解語(yǔ)音識(shí)別》從語(yǔ)音識(shí)別的歷史和基礎(chǔ)知識(shí)講起,通過(guò)圖解的方式對(duì)語(yǔ)音識(shí)別技術(shù)進(jìn)行了盡可能簡(jiǎn)單的解釋。內(nèi)容涉及語(yǔ)音學(xué)基礎(chǔ)知識(shí)、統(tǒng)計(jì)模式識(shí)別、有限狀態(tài)自動(dòng)機(jī)、語(yǔ)音特征的提取、聲學(xué)模型和語(yǔ)言模型、搜索算法和基于WFST 的語(yǔ)音識(shí)別技術(shù)等。此外,本書(shū)沒(méi)有將語(yǔ)音識(shí)別限定在“將語(yǔ)音轉(zhuǎn)換成文本”的傳統(tǒng)范疇內(nèi),而是在此基礎(chǔ)上,還講解了從語(yǔ)音識(shí)別技術(shù)到人機(jī)對(duì)話(huà)技術(shù)的演進(jìn)過(guò)程和方法。內(nèi)容涉及語(yǔ)義分析和語(yǔ)音對(duì)話(huà)系統(tǒng)的實(shí)現(xiàn)。

作者簡(jiǎn)介

  荒木雅弘(作者)1964年出生于日本大阪。1993年完成 了日本京都大學(xué)研究生院研究科信息工程專(zhuān)業(yè)博士課程的學(xué)習(xí)。先后擔(dān)任過(guò)京都大學(xué)工學(xué)部助教和京都大學(xué)綜合信息媒體中心講師。1999年開(kāi)始擔(dān)任日本京都工藝?yán)w維大學(xué)工藝系助理教授,2007年晉升為研究生院工藝科學(xué)研究科副教授。目前正在開(kāi)發(fā)以語(yǔ)義網(wǎng)為知識(shí)庫(kù)的對(duì)話(huà)系統(tǒng),研究用于多模態(tài)對(duì)話(huà)系統(tǒng)的描述語(yǔ)言。陳舒揚(yáng)(譯者)軟件開(kāi)發(fā)工程師,任職于某日企,從事軟件開(kāi)發(fā)工作。熱愛(ài)編程和游戲,崇尚開(kāi)源精神,對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的東西都很著迷。楊文剛(譯者)長(zhǎng)期從事軟件開(kāi)發(fā)和系統(tǒng)運(yùn)維工作?,F(xiàn)任職于某世界五百?gòu)?qiáng)企業(yè),探索數(shù)字化轉(zhuǎn)型業(yè)務(wù),內(nèi)容涉及大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)。

圖書(shū)目錄

目錄
第 1章 開(kāi)篇
1.1 什么是語(yǔ)音識(shí)別 2
1.2 語(yǔ)音識(shí)別的歷史 4
1.3 語(yǔ)音識(shí)別的用處 6
1.4 為什么很難 8
1.5 本書(shū)的目標(biāo) 10
1.6 小結(jié) 12
第 2章 什么是語(yǔ)音
2.1 語(yǔ)音學(xué) 16
2.2 聲音是如何產(chǎn)生的——發(fā)音語(yǔ)音學(xué) 16
2.3 聲音的真面目——聲學(xué)語(yǔ)音學(xué) 23
2.4 聲音是如何被感知的——感知語(yǔ)音學(xué) 29
2.5 總結(jié) 32
第3章 統(tǒng)計(jì)模式識(shí)別
3.1 什么是模式識(shí)別 34
3.2 統(tǒng)計(jì)模式識(shí)別的思路 36
3.3 生成模型的訓(xùn)練 40
3.4 判別模型的訓(xùn)練 44
3.5 統(tǒng)計(jì)語(yǔ)音識(shí)別的概要 45
3.6 總結(jié) 48
第4章 有限狀態(tài)自動(dòng)機(jī)
4.1 什么是有限狀態(tài)自動(dòng)機(jī) 50
4.2 用有限狀態(tài)自動(dòng)機(jī)表達(dá)的語(yǔ)言 53
4.3 各種各樣的有限狀態(tài)自動(dòng)機(jī) 55
4.4 有限狀態(tài)自動(dòng)機(jī)的性質(zhì) 58
4.5 總結(jié) 59
第5章 語(yǔ)音特征的提取
5.1 特征提取的步驟 62
5.2 語(yǔ)音信號(hào)的數(shù)字化 64
5.3 人類(lèi)聽(tīng)覺(jué)模擬——頻譜分析 67
5.4 另一個(gè)精巧設(shè)計(jì)——倒譜分析 69
5.5 噪聲去除 72
5.6 總結(jié) 73
第6章 語(yǔ)音識(shí)別:基本聲學(xué)模型
6.1 聲學(xué)模型的單位 76
6.2 什么是隱馬爾可夫模型 78
6.3 隱馬爾可夫模型的概率計(jì)算 81
6.4 狀態(tài)序列的估計(jì) 83
6.5 參數(shù)訓(xùn)練 85
6.6 總結(jié) 89
第7章 語(yǔ)音識(shí)別:高級(jí)聲學(xué)模型
7.1 實(shí)際的聲學(xué)模型 92
7.2 判別訓(xùn)練 94
7.3 深度學(xué)習(xí) 96
7.4 總結(jié) 98
第8章 語(yǔ)音識(shí)別:語(yǔ)言模型
8.1 基于語(yǔ)法規(guī)則的語(yǔ)言模型 100
8.2 統(tǒng)計(jì)語(yǔ)言模型的思路 101
8.3 統(tǒng)計(jì)語(yǔ)言模型的建立方法 103
8.4 總結(jié) 108
第9章 語(yǔ)音識(shí)別:搜索算法
9.1 填補(bǔ)聲學(xué)模型和語(yǔ)言模型之間的空隙 112
9.2 狀態(tài)空間搜索 113
9.3 用樹(shù)形字典減少浪費(fèi) 115
9.4 用集束搜索縮小范圍 116
9.5 用多次搜索提高精度 118
9.6 總結(jié) 120
第 10章 語(yǔ)音識(shí)別:WFST運(yùn)算
10.1 WFST的合成運(yùn)算 124
10.2 確定化 129
10.3 權(quán)重移動(dòng) 133
10.4 最小化 134
10.5 總結(jié) 135
第 11章 語(yǔ)音識(shí)別:使用 WFST進(jìn)行語(yǔ)音識(shí)別
11.1 WFST轉(zhuǎn)換 138
11.2 聲學(xué)模型的 WFST轉(zhuǎn)換 139
11.3 發(fā)音字典的 WFST轉(zhuǎn)換 141
11.4 語(yǔ)言模型的 WFST轉(zhuǎn)換 142
11.5 WFST的搜索 144
11.6 總結(jié) 145
第 12章 語(yǔ)義分析
12.1 什么是語(yǔ)義表示 148
12.2 基于規(guī)則的語(yǔ)義分析處理 151
12.3 基于統(tǒng)計(jì)的語(yǔ)義分析處理 153
12.4 智能手機(jī)的語(yǔ)音服務(wù) 156
12.5 總結(jié) 159
第 13章 語(yǔ)音對(duì)話(huà)系統(tǒng)的實(shí)現(xiàn)
13.1 對(duì)話(huà)系統(tǒng)的開(kāi)發(fā)方法 162
13.2 基于規(guī)則的對(duì)話(huà)管理 164
13.3 針對(duì)對(duì)話(huà)管理的統(tǒng)計(jì)方法 166
13.4 總結(jié) 170
第 14章 終篇
14.1 語(yǔ)音分析工具 WaveSurfer 174
14.2 HMM構(gòu)建工具 HTK 175
14.3 大詞匯量連續(xù)語(yǔ)音識(shí)別引擎 Julius 177
14.4 虛擬代理對(duì)話(huà)工具 MMDAgent 179
14.5 深入學(xué)習(xí)之路 180
思考題的解答 182
參考文獻(xiàn) 188
后 記 191

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)