漢語語音關(guān)鍵詞檢測中置信測度研究.pdf_第1頁
已閱讀1頁,還剩134頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、作為人們最方便、最自然的信息傳遞方式,語音在人類社會中無處不在。尤其是在信息和多媒體技術(shù)迅猛發(fā)展的今天,語音通信網(wǎng)絡(luò)和計(jì)算機(jī)互聯(lián)網(wǎng)上的語音數(shù)據(jù)正以前所未有的速度增長。對這些語音數(shù)據(jù)進(jìn)行分析和處理,并獲取人們感興趣的有用信息,具有重要的理論意義和實(shí)用價(jià)值。作為語音信息檢索的核心技術(shù),語音關(guān)鍵詞檢測(Spoken Term Detection,STD)以搜索并定位語音文檔中的特定詞為目的,在語音分析、信息檢索、數(shù)據(jù)挖掘、信息安全等領(lǐng)域有著廣

2、泛的應(yīng)用。
  近年來,語音關(guān)鍵詞檢測已經(jīng)成為語音處理領(lǐng)域的研究熱點(diǎn),吸引了大量學(xué)者展開廣泛而深入的研究。雖然取得了一定的進(jìn)展,但目前的檢測結(jié)果中仍不可避免地存在著大量錯誤,這降低了關(guān)鍵詞檢測系統(tǒng)的性能。從描述檢測結(jié)果的可信程度來看,錯誤的原因在于系統(tǒng)對真實(shí)的關(guān)鍵詞結(jié)果賦予了較低的置信測度(Confidence Measure),而對虛假的關(guān)鍵詞結(jié)果賦予了較高的置信測度。因此,有效的置信測度方法對語音關(guān)鍵詞檢測至關(guān)重要。然而,目前

3、的方法不僅訓(xùn)練準(zhǔn)則與評價(jià)準(zhǔn)則不一致,而且缺乏對高級語言學(xué)信息的有效利用;此外,面向詞表外詞的檢測仍存在召回率低的問題,尚無刻畫詞表外詞置信測度的有效方法。本文針對以上問題,從詞表內(nèi)詞與詞表外詞兩個方面展開研究,其主要研究內(nèi)容及創(chuàng)新工作如下:
 ?。?)針對目前置信測度訓(xùn)練準(zhǔn)則與評價(jià)準(zhǔn)則不一致的問題,提出了基于接受者操作特性(Receiver Operating Characteristics,ROC)曲線下面積(Area Unde

4、r ROC Curve,AUC)最大化準(zhǔn)則的置信測度。該方法利用輸入語音的聲學(xué)特征,以最大化AUC作為優(yōu)化目標(biāo),實(shí)現(xiàn)了一種子詞加權(quán)置信測度。同時,根據(jù)漢語特點(diǎn),提出了音節(jié)置信測度向量的表示方法,進(jìn)而實(shí)現(xiàn)了基于AUC最大化的音節(jié)加權(quán)置信測度。與現(xiàn)有基于最小分類錯誤準(zhǔn)則的方法相比,所提出的方法使訓(xùn)練準(zhǔn)則與評價(jià)準(zhǔn)則相一致,同時更有利于參數(shù)的訓(xùn)練,從而獲得更好的檢測性能。
 ?。?)針對現(xiàn)有方法缺乏對高級語言學(xué)信息有效利用的問題,提出了一

5、種基于上下文背景一致度的置信測度。它利用關(guān)鍵詞候選間的關(guān)系,將背景詞的不確定性與語音文檔主題的影響考慮到上下文背景一致度的計(jì)算當(dāng)中,并將上下文背景一致度作為置信測度。為此,利用詞出現(xiàn)概率估計(jì)背景詞的不確定性,通過合并Lattice中交疊候選來計(jì)算詞出現(xiàn)概率。為了考慮主題的影響,提出了基于主題的上下文背景一致度自適應(yīng)方法。該方法通過直接對主題分類并使用特定主題的語義相似度的思想實(shí)現(xiàn)自適應(yīng)。由于加入了背景詞不確定性和主題信息等先驗(yàn)知識,使上

6、下文背景一致度的計(jì)算變得更為準(zhǔn)確。實(shí)驗(yàn)表明,考慮背景詞的不確定性和基于主題的自適應(yīng)能使檢測性能有明顯提高。
 ?。?)針對詞表外詞檢測召回率低的問題,提出了一種基于關(guān)鍵詞擴(kuò)展的詞表外詞檢測方法及相關(guān)置信測度計(jì)算方法。該方法將與原始關(guān)鍵詞發(fā)音相似或易混的音節(jié)序列也作為關(guān)鍵詞進(jìn)行搜索。在根據(jù)所擴(kuò)展的關(guān)鍵詞定位可能的候選之后,利用候選的后驗(yàn)概率以及所擴(kuò)展的關(guān)鍵詞與原始關(guān)鍵詞之間的不匹配程度來計(jì)算其置信測度。擴(kuò)展的關(guān)鍵詞與原始關(guān)鍵詞間的混

7、淆度由聲學(xué)模型間K-L散度來度量。為了對K-L散度值進(jìn)行準(zhǔn)確估計(jì),提出了基于上下界的K-L散度估計(jì)方法。這一策略能夠有效處理漢語模糊匹配中的音節(jié)插入、刪除等情況,解決了不同長度音節(jié)串間不匹配度量的問題。同時,為了加快搜索關(guān)鍵詞的速度,提出了一種基于n元文法的樹狀索引。實(shí)驗(yàn)表明,所提出的基于關(guān)鍵詞擴(kuò)展的詞表外詞檢測方法能夠有效提高召回率,所提出的置信測度也能夠提高詞表外詞檢測性能。
 ?。?)針對詞表外詞檢測缺乏有效置信測度的問題,

8、提出了基于候選片段間相關(guān)度的詞表外詞置信測度。通過使用狀態(tài)對齊的方法對候選片段的邊界進(jìn)行準(zhǔn)確定位,并利用基于幀似然比的方法計(jì)算初始的置信測度。在此基礎(chǔ)上,提出了兩種基于相關(guān)性的置信測度重估方法,即基于反饋機(jī)制的置信測度和基于隨機(jī)游走模型的置信測度。前者根據(jù)偽相關(guān)集合和偽無關(guān)集合對每一個候選的置信測度進(jìn)行重新計(jì)算。后者利用任意兩個候選間的相關(guān)度和隨機(jī)游走模型完成置信測度重新計(jì)算。實(shí)驗(yàn)表明,所提出的詞表外詞置信測度能夠有效提升詞表外詞的檢測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論