注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能語(yǔ)音信號(hào)處理(第3版)

語(yǔ)音信號(hào)處理(第3版)

語(yǔ)音信號(hào)處理(第3版)

定 價(jià):¥89.00

作 者: 韓紀(jì)慶,張磊,鄭鐵然 著
出版社: 清華大學(xué)出版社
叢編項(xiàng): 人工智能科學(xué)與技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787302517603 出版時(shí)間: 2019-04-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 425 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書系統(tǒng)地介紹語(yǔ)音信號(hào)處理的基礎(chǔ)、概念、原理、方法與應(yīng)用。全書共分9章。第1章介紹語(yǔ)音信號(hào)處理及其發(fā)展過(guò)程; 第2章介紹語(yǔ)音信號(hào)的產(chǎn)生與人類聽覺的機(jī)理,傳統(tǒng)的線性語(yǔ)音產(chǎn)生模型,以及非線性語(yǔ)音產(chǎn)生模型; 第3章從語(yǔ)音信號(hào)的時(shí)域特征入手,引入時(shí)頻分析的思想,并進(jìn)一步闡述時(shí)頻分析中短時(shí)傅里葉變換和小波變換在語(yǔ)音信號(hào)特征分析中的應(yīng)用,最后對(duì)廣泛使用的倒譜特征以及同態(tài)解卷積進(jìn)行介紹; 第4章介紹語(yǔ)音信號(hào)的線性預(yù)測(cè)原理、解法、幾種推演方法以及線譜對(duì)分析法; 第5章介紹語(yǔ)音編碼的相關(guān)知識(shí),包括語(yǔ)音的波形編碼、極低速率語(yǔ)音編碼技術(shù),以及相關(guān)編碼器的性能指標(biāo)和評(píng)測(cè)方法; 第6章介紹語(yǔ)音識(shí)別的基本內(nèi)容,從基于矢量量化的識(shí)別技術(shù)到動(dòng)態(tài)時(shí)間歸正的識(shí)別技術(shù),從隱馬爾可夫模型技術(shù)到基于深度學(xué)習(xí)的語(yǔ)音識(shí)別技術(shù),從孤立詞識(shí)別到連接詞識(shí)別及連續(xù)語(yǔ)音識(shí)別技術(shù),再到關(guān)鍵詞檢出技術(shù),最后還介紹新興起的語(yǔ)音識(shí)別應(yīng)用技術(shù),以及用于HMM系統(tǒng)構(gòu)建的HTK工具和用于深度學(xué)習(xí)系統(tǒng)構(gòu)建的Kaldi工具等; 第7章介紹說(shuō)話人識(shí)別的基本內(nèi)容,從基于GMMUBM的識(shí)別技術(shù)到基于支持向量機(jī)的識(shí)別技術(shù),從基于聯(lián)合因子分析的識(shí)別技術(shù)到基于ivector的識(shí)別技術(shù),以及近年來(lái)受到關(guān)注的基于深度學(xué)習(xí)的識(shí)別技術(shù)等; 第8章介紹頑健語(yǔ)音識(shí)別技術(shù),從影響語(yǔ)音識(shí)別性能的環(huán)境變化因素分析開始,介紹噪聲環(huán)境下頑健語(yǔ)音識(shí)別技術(shù),以及變異語(yǔ)音識(shí)別的技術(shù); 第9章介紹語(yǔ)音合成的基本原理、線性預(yù)測(cè)合成、共振峰合成以及漢語(yǔ)按規(guī)則合成,以及基于HMM的合成技術(shù)等內(nèi)容。 本書可作為高等院校計(jì)算機(jī)應(yīng)用、信號(hào)與信息處理、通信與電子系統(tǒng)等專業(yè)及學(xué)科的高年級(jí)本科生、研究生教材,也可供該領(lǐng)域的科研及工程技術(shù)人員參考。

作者簡(jiǎn)介

  韓紀(jì)慶現(xiàn)任哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二級(jí)教授、學(xué)校長(zhǎng)聘崗教授、博士生導(dǎo)師。兼任中國(guó)中文信息學(xué)會(huì)理事及語(yǔ)音處理專委會(huì)副主任、全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議常設(shè)機(jī)構(gòu)委員會(huì)副主席、《中文信息學(xué)報(bào)》編委、《數(shù)據(jù)采集與處理》雜志編委。長(zhǎng)期從事語(yǔ)音信號(hào)處理、音頻信息處理等領(lǐng)域的教學(xué)與科研工作。作為項(xiàng)目負(fù)責(zé)人,正在主持和已經(jīng)完成“國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目”2項(xiàng)、“面上項(xiàng)目”5項(xiàng)、“國(guó)家973計(jì)劃”課題1項(xiàng)、教育部“跨世紀(jì)優(yōu)秀人才培養(yǎng)計(jì)劃”基金1項(xiàng)及其他科研項(xiàng)目10余項(xiàng)。獲省部級(jí)科技二等獎(jiǎng)3項(xiàng)、三等獎(jiǎng)2項(xiàng)。獲國(guó)家發(fā)明專利7項(xiàng)。已在國(guó)內(nèi)外刊物和會(huì)議上發(fā)表論文200余篇,并出版圖書5部。

圖書目錄

目錄




第1章緒論

1.1語(yǔ)音信號(hào)處理的發(fā)展

1.2語(yǔ)音信號(hào)處理的應(yīng)用

1.3語(yǔ)音信號(hào)處理的總體結(jié)構(gòu)

參考文獻(xiàn)

第2章語(yǔ)音信號(hào)的聲學(xué)基礎(chǔ)及產(chǎn)生模型

2.1語(yǔ)音信號(hào)的產(chǎn)生

2.1.1語(yǔ)音的發(fā)音器官

2.1.2語(yǔ)音的聲學(xué)特征

2.1.3語(yǔ)音信號(hào)在時(shí)域和頻域的表示

2.1.4漢語(yǔ)中語(yǔ)音的分類

2.1.5漢語(yǔ)語(yǔ)音的韻律特性

2.2語(yǔ)音信號(hào)的感知

2.2.1聽覺系統(tǒng)

2.2.2聽覺特性

2.2.3掩蔽效應(yīng)

2.3語(yǔ)音信號(hào)的線性產(chǎn)生模型

2.3.1激勵(lì)模型

2.3.2聲道模型

2.3.3輻射模型

2.4語(yǔ)音信號(hào)的非線性產(chǎn)生模型

2.4.1調(diào)頻調(diào)幅模型的基本原理

2.4.2Teager能量算子

2.4.3能量分離算法

2.4.4調(diào)頻調(diào)幅模型的應(yīng)用

參考文獻(xiàn)

第3章語(yǔ)音信號(hào)的特征分析

3.1語(yǔ)音信號(hào)數(shù)字化

3.1.1語(yǔ)音信號(hào)的采樣和量化

3.1.2短時(shí)加窗處理

3.2語(yǔ)音信號(hào)的時(shí)域分析

3.2.1短時(shí)能量分析

3.2.2短時(shí)平均過(guò)零率

3.2.3短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)

3.2.4端點(diǎn)檢測(cè)和語(yǔ)音分割

3.3語(yǔ)音信號(hào)的頻域分析

3.3.1濾波器組方法

3.3.2傅里葉頻譜分析

3.4傳統(tǒng)傅里葉變換缺點(diǎn)及時(shí)頻分析的思想

3.4.1信號(hào)的時(shí)頻表示

3.4.2不確定原理

3.5Gabor變換

3.6小波變換在語(yǔ)音信號(hào)分析中的應(yīng)用

3.6.1小波的數(shù)學(xué)表示及意義

3.6.2小波分析特點(diǎn)

3.6.3小波變換的多分辨分析

3.6.4小波變換在語(yǔ)音處理中的應(yīng)用

3.7語(yǔ)音信號(hào)的同態(tài)解卷積

3.7.1同態(tài)信號(hào)處理的基本原理

3.7.2語(yǔ)音信號(hào)的復(fù)倒譜

3.7.3避免相位卷繞的算法

3.7.4基于聽覺特性的Mel頻率倒譜系數(shù)

3.8語(yǔ)音信號(hào)特征應(yīng)用

3.8.1基音周期估計(jì)

3.8.2共振峰的估計(jì)

參考文獻(xiàn)

第4章語(yǔ)音信號(hào)的線性預(yù)測(cè)分析

4.1線性預(yù)測(cè)的基本原理

4.2線性預(yù)測(cè)方程組的解法

4.2.1自相關(guān)法

4.2.2協(xié)方差法

4.2.3格型法

4.2.4幾種求解線性預(yù)測(cè)方法的比較

4.3線性預(yù)測(cè)的幾種推演參數(shù)

4.3.1歸一化自相關(guān)函數(shù)

4.3.2反射系數(shù)

4.3.3預(yù)測(cè)器多項(xiàng)式的根

4.3.4LPC倒譜

4.3.5全極點(diǎn)系統(tǒng)的沖激響應(yīng)及其自相關(guān)函數(shù)

4.3.6預(yù)測(cè)誤差濾波器的沖激響應(yīng)及其自相關(guān)函數(shù)

4.3.7對(duì)數(shù)面積比系數(shù)

4.4線譜對(duì)分析法

4.4.1線譜對(duì)分析的原理

4.4.2線譜對(duì)參數(shù)的求解

4.5感知線性預(yù)測(cè)PLP系數(shù)

參考文獻(xiàn)

第5章語(yǔ)音編碼

5.1波形編碼

5.1.1均勻量化PCM

5.1.2非均勻量化 PCM

5.1.3自適應(yīng)量化PCM

5.1.4差分脈沖編碼

5.1.5自適應(yīng)差分脈沖編碼

5.1.6增量調(diào)制和自適應(yīng)增量調(diào)制

5.1.7子帶編碼

5.1.8自適應(yīng)變換域編碼

5.2參數(shù)編碼和混合編碼

5.2.1參數(shù)編碼

5.2.2基于全極點(diǎn)語(yǔ)音產(chǎn)生模型的混合編碼

5.2.3基于正弦模型的混合編碼

5.3極低速率語(yǔ)音編碼技術(shù)

5.3.1400bps~1.2Kbps的聲碼器

5.3.2識(shí)別合成型聲碼器

5.4語(yǔ)音編碼器的性能指標(biāo)和質(zhì)量評(píng)測(cè)方法

5.4.1編碼速率

5.4.2頑健性

5.4.3時(shí)延

5.4.4計(jì)算復(fù)雜度和算法的可擴(kuò)展性

5.4.5語(yǔ)音質(zhì)量及其評(píng)價(jià)方法

5.5語(yǔ)音編碼國(guó)際標(biāo)準(zhǔn)

5.6感知音頻編碼

5.6.1感知編碼的一般框架

5.6.2心理聲學(xué)模型

5.6.3常用的感知編碼標(biāo)準(zhǔn)

參考文獻(xiàn)

第6章語(yǔ)音識(shí)別

6.1概述

6.2基于矢量量化的識(shí)別技術(shù)

6.2.1Kmeans矢量量化算法

6.2.2LBG算法

6.3動(dòng)態(tài)時(shí)間歸正的識(shí)別技術(shù)

6.3.1DTW基本原理

6.3.2模板訓(xùn)練算法

6.4隱馬爾可夫模型技術(shù)

6.4.1HMM基本思想

6.4.2HMM基本算法

6.4.3HMM算法實(shí)現(xiàn)中的問題

6.4.4關(guān)于HMM訓(xùn)練的幾點(diǎn)考慮

6.5連接詞語(yǔ)音識(shí)別技術(shù)

6.5.1連接詞識(shí)別問題的一般描述

6.5.2二階動(dòng)態(tài)規(guī)劃算法

6.5.3分層構(gòu)筑方法

6.6大詞表連續(xù)語(yǔ)音識(shí)別中的聲學(xué)模型和語(yǔ)言學(xué)模型

6.6.1聲學(xué)模型

6.6.2統(tǒng)計(jì)語(yǔ)言學(xué)模型

6.6.3統(tǒng)計(jì)語(yǔ)言學(xué)模型平滑技術(shù)

6.6.4語(yǔ)言學(xué)模型自適應(yīng)技術(shù)

6.7大詞表連續(xù)語(yǔ)音識(shí)別中的解碼技術(shù)

6.7.1圖的基本搜索算法

6.7.2面向語(yǔ)音識(shí)別的搜索算法

6.8大詞表連續(xù)語(yǔ)音識(shí)別后處理技術(shù)

6.8.1語(yǔ)音識(shí)別中間結(jié)果的表示形式

6.8.2錯(cuò)誤處理

6.8.3最小字錯(cuò)誤率解碼方法

6.9基于HMM的自適應(yīng)技術(shù)

6.9.1基于Bayesian理論的自適應(yīng)方法

6.9.2基于變換的自適應(yīng)方法

6.10基于深度學(xué)習(xí)的語(yǔ)音識(shí)別技術(shù)

6.10.1基于DNNHMM的語(yǔ)音識(shí)別技術(shù)

6.10.2基于RNN的語(yǔ)音識(shí)別技術(shù)

6.10.3端到端的語(yǔ)音識(shí)別技術(shù)

6.11關(guān)鍵詞檢出技術(shù)

6.11.1問題描述

6.11.2關(guān)鍵詞檢出系統(tǒng)的組成

6.11.3垃圾模型建模方法

6.11.4語(yǔ)音解碼器的設(shè)計(jì)

6.11.5關(guān)鍵詞確認(rèn)過(guò)程

6.11.6關(guān)鍵詞檢出系統(tǒng)性能優(yōu)化

6.12語(yǔ)音識(shí)別的應(yīng)用技術(shù)

6.12.1語(yǔ)音信息檢索

6.12.2發(fā)音學(xué)習(xí)技術(shù)

6.12.3基于語(yǔ)音的情感處理

6.12.4網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別

6.12.5嵌入式語(yǔ)音識(shí)別技術(shù)

6.13HTK工具介紹

6.13.1數(shù)據(jù)準(zhǔn)備階段

6.13.2模型訓(xùn)練階段

6.13.3識(shí)別階段

6.14Kaldi工具介紹

6.14.1Kaldi工具簡(jiǎn)介

6.14.2Kaldi工具安裝

6.14.3數(shù)據(jù)準(zhǔn)備

6.14.4特征提取

6.14.5模型訓(xùn)練

6.14.6性能評(píng)測(cè)

參考文獻(xiàn)

第7章說(shuō)話人識(shí)別

7.1概述

7.2基于GMM與GMMUBM說(shuō)話人識(shí)別

7.2.1GMM的說(shuō)話人識(shí)別

7.2.2GMMUBM的說(shuō)話人識(shí)別

7.3基于SVM的說(shuō)話人識(shí)別

7.3.1SVM說(shuō)話人識(shí)別

7.3.2基于GMM均值超矢量的SVM說(shuō)話人識(shí)別

7.3.3基于GMM得分的SVM說(shuō)話人識(shí)別

7.4復(fù)雜信道下的說(shuō)話人識(shí)別

7.4.1特征映射

7.4.2說(shuō)話人模型合成

7.4.3擾動(dòng)屬性投影

7.4.4聯(lián)合因子分析

7.5基于ivector的說(shuō)話人識(shí)別

7.5.1基于GMMUBM的ivector說(shuō)話人識(shí)別

7.5.2基于DNN的ivector說(shuō)話人識(shí)別

7.6得分規(guī)整

7.6.1零規(guī)整

7.6.2測(cè)試規(guī)整

7.6.3說(shuō)話人自適應(yīng)的測(cè)試規(guī)整

7.6.4TZnorm

7.6.5Hnorm

7.6.6Cnorm

參考文獻(xiàn)

第8章頑健語(yǔ)音識(shí)別技術(shù)

8.1概述

8.2影響語(yǔ)音識(shí)別性能的環(huán)境變化因素

8.3噪聲環(huán)境下的頑健語(yǔ)音識(shí)別技術(shù)

8.3.1基于語(yǔ)音增強(qiáng)的方法

8.3.2通道畸變的抑制方法

8.3.3基于模型的補(bǔ)償方法

8.4變異語(yǔ)音識(shí)別方法

8.4.1變異語(yǔ)音的分析

8.4.2變異語(yǔ)音的分類

8.4.3變異語(yǔ)音的識(shí)別

參考文獻(xiàn)

第9章語(yǔ)音合成

9.1語(yǔ)音合成的基本原理

9.2參數(shù)合成方法

9.2.1線性預(yù)測(cè)合成方法

9.2.2共振峰合成方法

9.3波形拼接合成技術(shù)

9.3.1TDPSOLA算法

9.3.2FDPSOLA算法

9.4漢語(yǔ)按規(guī)則合成

9.4.1韻律規(guī)則

9.4.2多音節(jié)協(xié)同發(fā)音規(guī)則合成

9.4.3輕聲音節(jié)規(guī)則合成

9.4.4兒化音節(jié)的規(guī)則合成

9.5基于HMM的參數(shù)化語(yǔ)音合成技術(shù)

9.5.1基于HMM參數(shù)語(yǔ)音合成系統(tǒng)的訓(xùn)練

9.5.2基于HMM參數(shù)語(yǔ)音合成系統(tǒng)的合成階段

參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.talentonion.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)