心理聲學(xué)研究及其在語音增強上的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、心理聲學(xué)主要研究人耳對聲音信號的處理過程,建立聲音的物理性質(zhì)與其在聽覺產(chǎn)生的主觀感覺之間的聯(lián)系,從而得到相應(yīng)的心理聲學(xué)模型,最終在科學(xué)研究和工程實踐中加以應(yīng)用。本文主要研究心理聲學(xué)的掩蔽效應(yīng)、頻帶劃分以及參量模型,并給出了一種新的計算心理聲學(xué)波動強度的參量模型。在此基礎(chǔ)上,本文將心理聲學(xué)掩蔽效應(yīng)以及頻帶劃分應(yīng)用到了單通道語音增強上,給出了兩種基于心理聲學(xué)的單通道語音增強改進(jìn)算法:基于心理聲學(xué)掩蔽的單通道語音增強改進(jìn)算法以及基于心理聲學(xué)等

2、矩形帶寬(ERB)尺度劃分的多子帶譜減改進(jìn)算法。
  心理聲學(xué)波動強度與粗糙度一樣,是一種基本的心理聲學(xué)聽覺感知。一個重要的區(qū)別在于波動強度反映了聲音信號更慢的振幅波動。本文給出了一種新的基于ERB的波動強度計算模型。通過在ERB尺度上劃分75個濾波通道,并且將每個通道的廣義調(diào)制度(GMD)加權(quán)、濾波以及求和得到最終的波動強度值。新算法給出了一種新的將每個ERB中的GMD轉(zhuǎn)變成特性波動強度的方式。另外,新算法給出了用ERB尺度替代

3、Bark尺度。比較基于ERB尺度劃分的新算法和基于Bark尺度劃分的新算法可以發(fā)現(xiàn),基于ERB尺度劃分的新算法降低RMSE值到73%并且提高相關(guān)系數(shù)值到17%。另外,本文還給出了關(guān)于為何在最終計算特性波動強度時需要加權(quán)的原因。實驗仿真結(jié)果表明,與已有的Zwicker波動強度模型[1]相比較,本文的波動強度模型能夠降低RMSE值超過90%并且提高相關(guān)系數(shù)值高達(dá)23%。因此,本文的波動強度模型所計算得到的結(jié)果與主觀測試結(jié)果更加吻合。

4、  在心理聲學(xué)理論研究的基礎(chǔ)上,本文給出了基于聽覺掩蔽效應(yīng)和頻帶劃分的兩種單通道語音增強改進(jìn)算法。本文首先實現(xiàn)了Virag提出的基于心理聲學(xué)掩蔽的單通道語音增強算法,然后通過改進(jìn)Virag算法中的頻域掩蔽模型并引入時域掩蔽模型,得到改進(jìn)后的算法。在改進(jìn)的算法中,根據(jù)頻域掩蔽模型和時域掩蔽模型計算得到噪聲掩蔽閾,進(jìn)而調(diào)節(jié)譜減參數(shù)以得到噪聲降低、語音失真和殘留音樂噪聲這三者在人耳聽覺上的最好折中。另外,本文還給出了一個基于心理聲學(xué)ERB尺度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論