基于語音信息的多特征情緒識別算法研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、情感計算是對與情感相關、來源于情感或者影響情感方面的計算,其目的是賦予智能機器感知,理解和表達各種情感狀態(tài)的能力。情感識別是情感計算的關鍵研究內容,是實現(xiàn)和諧人機交互的重要基礎。目前,情感計算主要以表情、姿態(tài)、語音、文本和生理信號為基礎進行情感識別,其中語音信號,是情感信息表達的主要載體,且獲取方便,越來越受到研究人員的重視。尋找能夠準確表征語音情緒狀態(tài)的特征參數和有效的情緒狀態(tài)識別模型是語音情緒識別的主要困難,一直是研究的熱點之一。<

2、br>  本文主要以語音信息的情感特征參數和情感模型對四種情緒(happy, angry,sad,fear)識別的有效性為研究內容。首先,提取語音信號的樣本熵作為一個表征語音情緒狀態(tài)的特征參數,分析其在語音情緒識別中的區(qū)分性,并與傳統(tǒng)的聲學參數進行特征融合,用于情緒識別;然后,在傳統(tǒng)BP網絡基礎上,結合基于貢獻分析的PCA算法,建立了一種基于PCA貢獻分析的神經網絡語音情感識別模型。對實驗結果的分析表明,對樣本熵與傳統(tǒng)的聲學參數進行特征

3、融合可以改進分類器的性能;基于PCA與神經網絡建立的語音情感識別模型提高了識別效率。具體研究內容如下:
  (1)信號獲取。根據語音情感信號的產生機理和國際上對情感類型的劃分方法,綜合比較國內外典型情感語音數據庫,最終確定本文的情感類型劃分方法和采用的情感語音庫。
  (2)前期處理。對原始數據進行采樣、量化、預加重、分幀、加窗等預處理后,針對端點效應問題,本文提出基于樣本熵改進的兩級判別端點檢測算法。采用模糊C均值聚類算法

4、和貝葉斯信息判決算法確定雙門限閾值,將其作為第一級判別,初步判斷信號的起止點,然后將修正的過零率作為第二級判別,最終確定信號的起止點。
  (3)特征提取與特征選擇。本研究將樣本熵及目前比較成熟的聲學參數(包括語速、能量特征、基音頻率、MFCC)及其統(tǒng)計參數,進行特征融合應用于語音情緒識別。采用PCA貢獻分析對原始特征向量集合進行降維,得到最簡約向量集,降低網絡模型的復雜性,降低訓練時間。
  (4)語音情緒識別模型。本文在

5、傳統(tǒng)BP網絡基礎上,結合基于貢獻分析的PCA算法,建立一種基于PCA的神經網絡語音信號情感識別模型?;谏鲜鋈诤系奶卣鳎迷撉楦心P蛯?00個樣本的四種情緒狀態(tài)進行識別。實驗結果分析表明:(a)樣本熵是一個能夠表征語音信號情感變化的有效參數。樣本熵和傳統(tǒng)聲學特征參數的融合可以顯著提高分類器的識別率,改善情感識別模型的性能。(b)基于PCA貢獻分析的神經網絡語音情感識別模型解決了傳統(tǒng)BP算法計算量大,運算速度慢的問題,有效的提高了系統(tǒng)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論