

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、自動說話人識別(ASR)技術以其顯著的低成本、使用方便和有效性等特點,成為生物認證技術研究的重要領域之一。該技術具有廣闊的應用前景,在信息領域、銀行及證券交易機構、公安司法、軍事領域、保安和證件防偽等方面能發(fā)揮巨大的作用,但說話人識別的研究還面臨許多問題,比如說話人語音具有變動性,容易被模仿,以及環(huán)境噪聲以及信道失真對語音特征的損害難以消除,因此有必要對其進行討論和研究。
本文以提高說話人識別系統(tǒng)性能出發(fā),在系統(tǒng)介紹說話人
2、識別理論和該技術存在的各種困難的基礎上,圍繞特征和模型兩個重要方面進行研究。在特征方面,主要研究四種倒譜特征的性能,線性預測倒譜系數(shù)(LPCC)和梅爾頻率倒譜系數(shù)(MFCC)相比較,感知線性預測系數(shù)(PLPC)以及它的改進特征一相對譜變換的感知線性預測系數(shù)(RASTA-PLPC);在模型方面,詳細介紹了混合高斯模型(GMM)和支持向量機(SVM)模型理論知識,并在二者特性認識的基礎上,建立了GMM與SVM的組合模型。具體研究工作如下:<
3、br> (1)多種特征性能的總結與分析。本文詳細分析了四種靜態(tài)特征、它們的動態(tài)(差分)特征以及它們與各自動態(tài)特征的組合特征的性能,分別從純凈語音和帶噪語音的說話人識別考察PLPC及RASTA-PLPC的優(yōu)勢,根據(jù)理論和實驗,可以得出以下結論:在這些特征中,基于聽覺原理的PLPC與其動態(tài)特征的組合對純凈語音的說話人識別效果最佳,而基于通道損失補償?shù)腞ASTA-PLPC與其動態(tài)特征的組合具有較強的抗噪性,對帶噪語音的說話人識別具有不錯
4、的效果。
(2)特征變換的探討。為了進一步改進特征的性能,文章采用主分量分析(PCA)變換對初始特征進一步處理,剝離其中的非說話人個性信息,雖然試驗中沒有得到預期效果,但該思想是特征研究的一個重要方向。
(3)說話人識別模型的研究和改進。GMM模型具有良好的數(shù)據(jù)分布描述特性,但樣本量需求大;而SVM模型是專門針對小樣本而設計的分類器,區(qū)分性能優(yōu)越,但類別多時,非常耗時,對此建立了二者的混合模型,試驗結果驗證了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于倒譜特征的說話人識別算法研究.pdf
- 說話人識別方法的研究.pdf
- 基于說話人轉換的語音識別方法.pdf
- 基于PLDA模型的說話人識別方法研究.pdf
- 基于小波變換的說話人識別方法研究.pdf
- 基于模型聚類的說話人識別方法研究.pdf
- 基于深度學習的說話人識別方法的研究.pdf
- 基于GMM和SVM的說話人識別方法研究.pdf
- 基于VQ-HMM的說話人識別方法研究.pdf
- 說話人識別方法與策略的研究.pdf
- 基于稀疏編碼的魯棒說話人識別方法研究.pdf
- 基于改進高斯混合模型的說話人識別方法研究.pdf
- 基于GMM-UBM的快速說話人識別方法.pdf
- 基于混合倒譜MFCC和GFCC的聲紋識別方法的研究.pdf
- 噪聲環(huán)境下說話人識別方法研究.pdf
- 基于高層信息融合的短語音說話人識別方法研究.pdf
- 基于Fisher準則和數(shù)據(jù)融合的說話人識別方法研究.pdf
- 噪音環(huán)境下說話人識別方法.pdf
- 與文本無關的說話人特征提取及識別方法研究.pdf
- 電子偽裝語音下的說話人識別方法研究.pdf
評論
0/150
提交評論