-
簡介:人類有個理想,讓機器具有“聽”、“說”人類語言的能力。這個理想,在信息時代正逐步變成現實。語音識別正是解決機器“聽”懂人類語言的一項研究。孤立詞語音識別實現簡單、技術成熟,有著廣泛的應用前景,是深入研究語音識別的基礎。本文對小詞匯量、非特定人的漢語孤立詞的語音識別技術進行了分析和研究。首先介紹了語音識別系統(tǒng)的組成和識別原理,并對語音信號的預處理過程、端點檢測常用的特征參數以及語音識別的方法作了分析,重點討論了MFCC特征參數的提取。繼而重點研究了孤立詞的端點檢測算法,并在基于信息熵、子帶譜熵和頻帶方差的端點檢測算法的基礎上,對原有算法做了修正和改進,仿真結果表明,在不同噪聲下,基于改進的端點檢測算法在低信噪比條件下的檢測準確率明顯高于傳統(tǒng)的基于能量和過零率的雙門限檢測算法,其中基于改進的頻帶方差的檢測效果最好。最后深入研究了基于DTW和HMM的語音識別方法。其中基于DTW的高效算法具有運算復雜度低的特點,仿真結果表明,它非常適合于小詞匯量、特定人的語音識別,識別率可以達到100%。但是對于非特定人識別,本文選用主流的基于HMM的識別方法,并仔細探討了CHMM應用到語音識別中的具體問題。結合改進的端點檢測算法并采用基于CHMM的語音識別方法,最終實現了對自建的漢語孤立數字語音庫92%的平均識別率。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 83
大?。?4.61(MB)
子文件數:
-
簡介:劣妻。未交L占】715二碩士學位論文基于語音識別的漢語發(fā)音評測研究RESEARCHOFMANDARINPRONOUNCINGEVALUATIONBASEDONSPEECHRECOGNITION作者謝朝強導師苗振江北京交通大學2010年6月學位論文版權使用授權書\帆Y帆1M7帆8叭們0叭7M4LL\\0帆本學位論文作者完全了解北京交通大學有關保留、使用學位論文的規(guī)定。特授權北京交通大學可以將學位論文的全部或部分內容編入有關數據庫進行檢索,提供閱覽服務,并采用影印、縮印或掃描等復制手段保存、匯編以供查閱和借閱。同意學校向國家有關部門或機構送交論文的復印件和磁盤。保密的學位論文在解密后適用本授權說明學位論文作者簽名銥磊日禹導師簽名弓予厶I,Z簽字日期_I口年多月叫EL簽字日期加,B年∥尾/,日
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 120
大?。?4.07(MB)
子文件數:
-
簡介:隨著WEB20的興起和社會網絡的迅速發(fā)展,人們以網絡為媒介發(fā)表自己對某個事件或事物的評論和看法。產品評論作為最重要的情感信息來源,一直被學術界廣泛使用。如何挖掘這些產品評論中所蘊含的豐富情感信息,成為當前自然語言處理NATURALLANGUAGEPROCESSING,NLP相關領域的研究熱點之一。復述是指使用不同的詞匯來表達相同含義的句子或短語。由于復述具有廣泛的獲取來源,且可以引入豐富的語言特征,所以復述在NLP的很多領域中都有重要的應用。本文在深入分析漢語產品評論的復述特點基礎上,從語義角度出發(fā),探索語義和情感極性相融合的意見復述抽取方法。并將獲取的復述知識應用于漢語產品意見文本分析,以緩解統(tǒng)計情感分析所面臨的數據稀疏問題,從而提高了情感分析性能。具體地,本文從以下三個方面展開研究1基于語素的漢語未登錄詞詞義預測。未登錄詞的詞義預測一直是制約漢語詞義消歧性能的一個瓶頸。為了獲取情感分類所需的詞義信息,本文以語素作為基本標注單位,在最大熵模型的框架下融合未登錄詞語內部結構特征和外部上下文特征,提出一種基于語素的漢語詞義預測方法。實驗結果表明,基于語素的方法可以有效融合詞語內部特征,從而提高了未登錄詞詞義預測的準確性。2融合語義和情感極性的漢語意見復述識別。本文在分析漢語意見復述特點的基礎上,以意見要素為基本單位,探索語義和情感極性相融合的意見復述識別方法,并分析和比較了不同的復述識別方法。實驗結果證明了融合語義和情感極性的意見復述識別方法的有效性。3基于復述生成的漢語情感分類。為了解決統(tǒng)計情感分類面臨的數據稀疏問題,本文引入復述生成技術,通過對訓練數據和測試數據同時進行復述生成,不僅擴展了訓練語料的規(guī)模,還通過測試數據復述擴展,彌補了訓練語料覆蓋度不足而引起的數據稀疏問題。在不同條件下的情感分類實驗結果證明引入復述生成可以顯著提高情感極性分類的性能。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數: 72
大?。?3.38(MB)
子文件數:
-
簡介:句法分析的任務是根據給定的語法,自動推導出句子的語法結構。句法分析性能的提高將對信息檢索、信息抽取以及機器翻譯等應用產生重要的推動作用。在句法分析的研究中,依存語法以其形式簡潔、易于標注、便于應用等優(yōu)點,逐漸受到研究人員的重視。目前,已經被自然語言處理領域的許多專家和學者所采用,應用于多種語言之中。但由于語料資源以及技術等原因,漢語在依存句法分析方面的相關研究并不多。為了彌補這方面的不足,本文使用基于語料庫的統(tǒng)計學習方法,對漢語的依存句法分析技術進行了探索。首先,實現了一個包含分詞和詞性標注的詞法分析系統(tǒng),并增加了動詞子類標注的功能。區(qū)分動詞的語法屬性是為了減少由動詞引起的語法歧義,降低句法結構的復雜度。本文首先制定了一個動詞細分類體系,將動詞分為8個子類,然后使用最大熵的方法對動詞進行子類標注,用以改善句法分析的性能。其次,進行了短語分析的工作。名詞復合短語是各種語言中的普遍存在的一種語法結構,對信息抽取、機器翻譯等應用有很大的影響。由于傳統(tǒng)的句法分析對此類結構的處理不夠理想,本文對名詞復合短語進行專門處理,以降低句法分析的難度。針對漢語名詞復合短語的特點,本文提出一種基于隱馬爾科夫樹模型的名詞復合短語分析方法,較好地解決了此類短語對句法分析的影響。另外,句法分析對句子的長度非常敏感,隨著長度的增加,句法分析的效率以及準確率均會受到嚴重的影響。為了減少句子長度的影響,本文對句子片段進行識別。先將句子劃分為多個片段,并使用基于支持向量機的方法對每個片段類型進行識別;然后對片段進行依存分析,再識別出各片段之間的依存關系,最后將各個片段組合為一個完整的分析樹。在以上三種技術基礎之上,根據漢語的特點,本文探索了一個高效的漢語依存句法分析算法。針對漢語語法結構靈活、樹庫資源不是非常充分的情況,本文使用分治策略對句子中的一些特定語法結構進行預處理。在搜索算法上,使用動態(tài)局部優(yōu)化的確定性分析算法對句子進行解碼,提高了搜索的效率。為了檢驗漢語依存句法分析方法的擴展性,并探索單語依存分析同多語依存分析的不同之處,本文最后實現了一個基于分步策略的多語依存分析系統(tǒng),并在CONLL2006的數據集上進行了實驗。通過對實驗結果的分析以及同評測結果的比較,驗證了本文方法的有效性。本文前面的詞法分析、短語分析、句子片段識別三部分工作是為句法分析服務的,每部分工作在不同層面上解決了漢語依存分析中的難點問題,對句法分析工作做了有力的支撐。后面的兩部分工作分別在漢語和多語方面對依存句法分析做了理論和技術上的探索。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數: 140
大小: 1.89(MB)
子文件數:
-
簡介:句法分析是自然語言處理研究中的關鍵技術之一其任務是根據給定的語法自動推導出句子的語法結構。它對于機器翻譯、信息檢索、信息抽取、文本分類和自動文摘等自然語言處理系統(tǒng)都有著極其重要的意義。句法分析是依賴于某種語法理論的在形式語法體系中依存語法逐漸成為研究人員重視的熱點。依存句法分析技術也不斷得到發(fā)展和完善并在英語等印歐語言中取得較好的研究成果。但目前為止針對漢語在依存句法分析方面的相關研究并不多見漢語的依存分析研究成果與比印歐語言遜色得多。為此本文采用基于統(tǒng)計理論的學習方法針對漢語特有的語法特點對漢語的依存句法分析方法進行了研究和探索。本文主要采用決策式的依存句法分析方法解決了漢語句法分析中存在的一些問題。本文工作的主要貢獻和創(chuàng)新點如下1提出并實現了一種針對漢語長句的決策式分析方法CLDP。該方法針對漢語復雜長句句法分析存在的困難考慮一種“分而治之”的處理策略采用分層分析的方法把復雜的句法分析問題分解為幾個易于處理的子問題以降低分析難度提高分析效率。本文提出并實現了非貪婪的考慮長距離依存的決策式漢語分析方法NCLDP。該方法利用漢語句子中根的唯一性對長句進行了分割。實現時利用機器學習方法SVM設計了一種高效的根搜索器ROOTSEARCHER該根搜索器ROOTSEARCHER可以標記出每個句子的根結點依據根結點句子被分割成兩個子句。對子句分別進行依存分析后進行子句的連接。把兩個子句的根結點合二為一合并兩個子依存結構從而得到長句的完整的依存結構。實驗數據表明本文構造的根搜索器ROOTSEARCHER具有較高的準確性。在長句占的比例較大的訓練集和測試集上本文的方法達到了較好的分析性能有效降低了句子的復雜度顯著地提高了句法分析器的準確率。2提出并實現了一種基于二段式的子句依存分析方法TSP。本文針對決策式依存分析中存在的EARLYREDUCE問題設計并實現了二段式的子句依存分析方法。該方法采用了有效的特征組合利用二段分析特征復用等手段有效解決了漢語右依存中動詞與動詞之間以及動詞與介詞之間的VPEARLYREDUCE問題并且降低了算法的貪婪性。另外本文提出并實現了子句的雙向分析策略BSP。根據分割后句子的特點以及漢語語言所具有的投影性特征提出了采用向前分析和向后分析相結合的策略。在分析時將從前向后與從后向前兩種分析方向結合使用。實驗中將二段式句法分析策略與一次分析進行了性能比較并考察了句法分析方向對于分析結果的影響。實驗結果表明本文的二段式的子句依存分析方法TSP提高了句法分析器的性能。子句的雙向分析策略BSP也比單向分析獲得了更好的分析效率。3提出并實現了一種基于介詞短語右邊界的自動識別的依存句法分析算法RPP。根據介詞短語的語用特征提出一種對介詞短語的后續(xù)詞進行分析的方法相應得到介詞短語右邊界的識別方法。通對過介詞短語的分析有效解決了決策式分析方法在分析介詞短語時存在的缺陷。避免了分析介詞在長距離依存時由于過早比較、提前決策依存關系出現的錯誤。實驗結果表明本文實現的基于介詞短語右邊界的自動識別的依存句法分析算法RPP對漢語的介詞的長距離依存分析是有效的。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數: 120
大?。?3.88(MB)
子文件數:
-
簡介:解決耳聾患者聽覺問題已是當今世界的一大難題傳統(tǒng)的方法有佩戴助聽器和植入電子耳蝸但二者都有明顯的缺陷前者將聲音信號簡單的放大只適用于輕度耳聾患者依賴于殘余聽覺神經后者也要利用人的聽覺神經并且其植入手術復雜造價過高不適于廣泛的推廣。而皮膚聽聲器完全不依賴于殘余聽覺神經僅依靠皮膚感受電刺激然后將電流信號傳遞給大腦使佩戴者能通過皮膚感受到外界的聲音。但是由于目前研制的變壓式皮膚聽聲器是單通道的聾人佩戴皮膚聽聲器后能夠感知聲音但不能夠很好的理解語意即其語音辨析能力不理想。為使皮膚聽聲器能夠辨析簡單語音本文主要進行了兩個方面的研究首先應用時頻分布理論比較分析語音信號語譜圖提供的時域和頻域信息總結出漢語語音關鍵頻率的大致分布情況并以此為基礎為后續(xù)皮膚聽聲器辨析語音提供理論依據其次將語音識別技術應用于皮膚聽聲器并設計了皮膚聽聲器系統(tǒng)該系統(tǒng)能夠辨析簡單的語音。本系統(tǒng)以MATLAB軟件為平臺主要功能有錄制語音、播放語音、預處理、分段濾波、特征提取和辨析語音。根據系統(tǒng)主要功能將其分為三個模塊采集模塊、處理模塊和辨析模塊。采集模塊將語音錄制成WAVE文件然后播放語音得到其波形圖和語譜圖處理模塊對語音信號進行預處理然后分段濾波將信號通過濾波器組分成M個子帶每個子帶通過電極片將電刺激傳遞給皮膚接下來提取語音的MFCC參數作為特征參數辨析模塊將待測語音信號的特征參數與數據庫中參考模板的特征參數進行模式匹配找出相似度最高的參考模板所對應的發(fā)音即為所要辨析的結果然后將辨析結果輸出。以“0、1、2、3、4、5、6、7、8、9”十個語音為例進行仿真實驗仿真結果表明每個語音都得到了較為準確的辨析說明本系統(tǒng)能夠辨析簡單語音基本完成皮膚聽聲器辨析語音的任務
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數: 70
大?。?11.26(MB)
子文件數:
-
簡介:該文對漢語語音識別中的聲學模型進行了理論研究和實驗分析研究成果主要有以下7個方面1首次將FISHER算法應用于語音模型的狀態(tài)分割2對廣義模型算法的收斂性進行了分析3根據漢語語音特點該文首次在廣義模型中引進了首、尾寂靜狀態(tài)的零懲罰自環(huán)并成功構造了一種無需端點檢測算法的漢語普通話識別器4從信息熵的角度出發(fā)對兩個隨機序列發(fā)生器簡單語音模型和隱馬爾可夫模型之間的相似度進行比較分析5該文首次指出漢語語音的音尾部分對其特征的作用很小甚至完全切除音尾部分對最終識別結果影響不大6該文回顧了語音識別系統(tǒng)所涉及的功能模塊綜述了各模塊常用的算法7首次實現了基于語音識別技術的漢語發(fā)音輔助教學系統(tǒng)
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數: 103
大?。?2.9(MB)
子文件數:
-
簡介:在神經解剖學和神經心理學層次上仿真和描述大腦中語音生成和理解相關區(qū)域的功能是近年來人工語音合成系統(tǒng)追求的主要目標。圍繞這一目標,許多學者在語音神經網絡計算模型的研究方面做出了巨大努力。其中最突出的是波士頓大學語音實驗室的岡瑟教授FRANKHGUENTHER及其團隊研究的DIVADIRECTIONSINTOVELOCITIESOFARTICULATS模型。它是一種可以描述語音生成與獲取相關的處理過程,并可以通過控制一個模擬聲道生成單詞、音節(jié)或音素的神經網絡模型。但是,DIVA模型是以英文29個基本音素為研究背景,其在漢語語音研究過程中存在局限性。針對DIVA模型及漢語語音研究的特點,本文主要進行如下研究首先,針對DIVA模型所采用的語音感興趣區(qū)域是基于英語語音研究而制定的問題,本文對漢語語音加工過程進行功能磁共振成像實驗研究,并基于DIVA模型對實驗結果進行分析。這為完善DIVA模型,使其適用于漢語語音研究提供了可行的方案。其次,針對漢語神經分析系統(tǒng)研究中,非侵入式腦機接口采集到的腦電數據存在的分辨率低、干擾大的問題,本文提出了一種基于DIVA模型的腦電信號約束處理方法。使用模型模擬生成的功能性磁共振成像數據激活點的空間信息作為限制條件,對腦電信號進行分析定位。實驗結果表明該處理方法可以對受試者的激活腦區(qū)進行精確定位。本文的研究為使用DIVA模型進行漢語語音研究提供了可行的方案和數據處理方法,實驗過程中形成的影像數據集將對漢語語音相關研究提供重要的參考。
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數: 63
大?。?2.02(MB)
子文件數:
-
簡介:隨著虛擬現實技術的發(fā)展,對三維虛擬人的研究成為虛擬現實領域的熱點。在電視動畫和計算機游戲中,逼真的模型給人以良好的視覺效果。近些年來,越來越多的學者對虛擬人的建模以及虛擬人的驅動方式的研究表現出極大的興趣,并分別提出了自己的方法。三維虛擬人驅動方法的研究不僅減少了開發(fā)商的投資,而且讓用戶有更大的選擇范圍,所以,它的商業(yè)價值與實用價值都是不可估量的。由于語音與口型有明顯的映射關系,可以通過這種映射關系實現語音信號對虛擬人口型動畫的驅動。而語音與虛擬人的動作之間則沒有直接的對應關系,很難通過語音信號直接驅動虛擬人動作。雖然目前研究者們已經提出了許多方法,實現了對虛擬人的驅動,但是方法的復雜度較高,有必要對其進行進一步改進。針對上述問題,本文提出一種基于漢語語音識別的方法驅動虛擬人,該方法通過語音識別,可以分別驅動虛擬人的肢體動作與面部動畫。首先,建立語音識別模塊,將語音信號轉化為文本信息其次,將語音識別模塊加入到虛擬人聊天系統(tǒng)中,實現語音信號對虛擬人動作的驅動和聊天系統(tǒng)的控制接著將語音識別模塊加到三維人臉口型動畫的系統(tǒng)中,實現語音信號對虛擬人口型動畫以及表情細節(jié)的驅動,并通過TTS技術,得到與輸入語音同步的三維人臉動畫。本文使用微軟語音開發(fā)包,首先通過構建語音識別類,從而建立語音識別模塊,完成語音信號到文本信息的轉換,接著將語音識別模塊分別添加到虛擬人聊天系統(tǒng)和三維虛擬人臉動畫的系統(tǒng)中,實現了漢語語音信號對虛擬人動作和面部動畫的驅動。最后,實驗結果表明該方法簡單實用,識別的準確率也能被用戶所接受。
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數: 55
大?。?5.64(MB)
子文件數:
-
簡介:2001年TIMBERNERS首次提出了語義網的概念。但是隨著研究的深入,越來越多的研究者注意到了當今網絡與語義網之間的差距,一方面是當前的萬維網上存在的大量HTML文檔是為人類閱讀準備的,而不是為了機器處理。網頁知識由自然語言結合HTML標記表示,計算機無法利用這些知識的語義信息,無法滿足用戶的高級需求。另一方面,語義網要求網絡資源的語義知識被加到文檔中去,文檔是機器可以處理的。信息抽取、分詞、詞性標注、句法分析等語義標注技術都相對比較成熟,將語義標注應用于網絡資源越來越受人們的關注,逐漸成為語義網研究的重要組成部分。本體的本質就是通過對領域內概念和概念之間關系的嚴格定義來確定概念的精確含義,從而提供對該領域知識的共同理解,達到知識的共享和重用,使該領域內的不同系統(tǒng)、模型間能夠進行互操作。本體作為一種能在知識層面提供知識共享和重用的工具,為語義網提供了可共享、概念化的知識模型。網絡資源的語義標注是語料庫的標注思想和技術在網絡中的應用。文章第一章主要介紹了網絡標注提出的背景及在國內外的研究現狀。第二章介紹了框架語義學、漢語框架網絡工程及基于漢語框架的領域本體的構建。第三章重點介紹了網絡標注的流程,及各流程的實現。并在通過介紹漢語框架網絡本體構建和網絡標注相關知識和背景,分析網絡標注流程和流程的實現技術的基礎上,提出了基于漢語框架本體的網絡標注模型。分別從本體管理、信息獲取、依存處理、角色標注和結果存儲五個方面對網絡標注進行闡述。文章第四章,從文本匹配和最大熵兩個方面為例,對網絡標注角色賦予的算法和實現進行說明,并以“盜竊”框架中的詞元“偷”為例進行了例證。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 54
大小: 2.38(MB)
子文件數:
-
簡介:隨著現代計算機技術的發(fā)展,人與計算機之間的通信接口已經不局限于鼠標和鍵盤。越來越多的新通訊手段被引入到計算機,技術的發(fā)展讓語音數字處理和語音識別技術進展使語音逐漸成為一個有效的輸入。廣大人民夢想出現能直接聽懂人的語言的機器,直接通過語音下指令,語音識別的技術指的是讓計算機通過對語音的處理和轉化,把人的語音溝通變成為相應的指令或者是文字。語音識別技術相關領域的多學科研究,其中包括了聲學,語言學,數字信號處理,計算機科學,人工神經網絡在不同領域的研究等等為語音識別技術的發(fā)展作出了貢獻。語音信號自身的特點造成的困難,這些特點包括可變性,動態(tài),瞬時性和連續(xù)性。計算機語音識別處理和語音識別過程中基本上是相同的。目前主流的語音識別技術是基于統(tǒng)計模式識別的基本理論。語音識別技術研究現在的困難是確定最優(yōu)化的識別結果,以及神經網絡的參數訓練。具有大量的神經元的人工神經網絡并行分布式計算的原則,高效率的學習算法以及能夠模仿人類的認知系統(tǒng),所以它非常適合于解決類似的語音識別這種問題,對于底層和頂層均很試用。我們知道神經網絡來源于對人腦功能的模擬,具有自組織性、自適應性、和連續(xù)學習的能力。神經網絡是可以訓練的,也就是說可以通過不斷的經驗訓練來積累和改進。加上具有并行性的特質,神經網絡具有魯棒性和快速判決的能力,適用于應對算法不能明確描述的場景,但是具有不限量的學習樣本可以使用。本文研究了語音識別中孤立詞語音識別的方法和特點,分別對語音信號特征參數LPCC和MFCC的提取進行了分析,通過探討端點檢測對語音識別系統(tǒng)的影響,并結合提高語音識別系統(tǒng)穩(wěn)健性的方案,對傳統(tǒng)的端點檢測方法做了一定的改進,采用基于MFCC的距離測量法提高了語音識別系統(tǒng)端點檢測方法的準確性?;谡Z音識別中的倒譜技術,實現了語音識別中LPC、LPCC、MFCC等幾種特征參數的提取方法;分析了神經網絡建模方法及其特點。另外還從隱馬爾可夫模型的幾個基本的步驟開始評估步驟、解碼步驟、訓練步驟入手進行討論了其作為如何使用語音識別應用主要數學模型當前的基本原理,并對這些技術在分析語音識別中如何應用。最后在此理論基礎上,針對非特定人的漢語孤立詞識別問題,研究構造了基于HMM和神經網絡建模的語音識別算法。該算法的意義主要在于在以隱馬爾可夫模型HMM為基本語音模型的基礎上,引入BP神經網絡進行二次識別,有效的利用了隱馬爾可夫模型的強時序信號處理能力和BP神經網絡的強模式分類和泛化性能,改善了孤立詞識別系統(tǒng)的抗噪性能。以往的算法主要是用傳統(tǒng)的DTW或HMM方法,該算法則將神經網絡應用于該領域,將HMM模型和神經網絡BP模型聯合起來應用于語音識別當中,提高了小詞匯量非特定人漢語語音的識別率,表明了混合網絡在語音識別中的優(yōu)勢。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 62
大小: 4.77(MB)
子文件數:
-
簡介:語音識別技術經過近半個世紀的發(fā)展已日趨成熟。然而由于漢語結構復雜單音節(jié)為主同音字多方言多語法亦不規(guī)范等問題目前漢語語音識別還沒有達到理想的程度距漢語識別實用化還有很大的距離。本文就漢語孤立詞識別系統(tǒng)的基本原理與實現方法進行了詳細的分析和闡述并對具體實際中的部分技術細節(jié)進行了探討。本文首先介紹了語音識別的定義及其意義及國內外發(fā)展狀況并簡要說明了語音識別的基本原理。其次根據語音識別系統(tǒng)的基本原理構成模型介紹了預處理、端點檢測到模板生成及模板管理和模板匹配各部分所涉及到的語音數字信號處理、模式識別等方面的基本原理并討論了在PC機上實現語音識別系統(tǒng)的幾種途徑。接著本文介紹了使用VISUALC60根據DTW動態(tài)時間彎折模型的語音識別訓練和識別的基本方法在WINDOWS操作系統(tǒng)上實現的一個簡單的非特定人、小詞匯量、孤立詞語音識別系統(tǒng)。系統(tǒng)的組成模塊與語音識別系統(tǒng)的基本構成模型基本一致在訓練過程中從語音庫中的波形文件中讀取采樣數據分幀計算出由12維線性預測系數和12維線性預測倒譜系數構成的特征矢量并按照聚類的方法進行訓練得到后續(xù)語音識別時需要的模板存放于模板庫中。識別時計算出輸入語音的特征矢量參數依據模板匹配的方法與模板庫中的語音模板逐一進行比較得出最佳的匹配模板或作出拒識判斷。最后對系統(tǒng)性能進行了小結指出了該系統(tǒng)的改進方向。最后本文對系統(tǒng)性能進行了小結指出了該系統(tǒng)的改進方向。通過對實際語音識別系統(tǒng)的測試和研究為進一步開發(fā)實用性語音識別系統(tǒng)做了基礎性的探究工作。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 45
大?。?0.54(MB)
子文件數:
-
簡介:分類號密級UDC學號406107511075南昌大學碩士研究生學位論文漢語孤立詞語音識別系統(tǒng)設計漢語孤立詞語音識別系統(tǒng)設計THEDESIGNOFISOLATEDCHINESEWDSPEECHRECOGNITIONSYSTEM熊中諒培養(yǎng)單位(院、系)信息工程學院自動化系指導教師姓名、職稱彭杰教授指導教師姓名、職稱張肅宇教授申請學位的學科門類工學學科專業(yè)名稱控制理論與控制工程論文答辯日期2014年5月25日答辯委員會主席評閱人2014年月日摘要摘要隨著各式機器在生產和生活中發(fā)揮著重要作用,因此改善人與機器的關系就顯得尤為重要。語音識別作為一種具備良好體驗的人機交互媒介,對其展開的研究具有重要的實際意義。文中介紹了語音識別理論和技術發(fā)展過程,對其主要方法作了較詳細的論述和分析,特別對近年來呈現出主流發(fā)展方向的隱馬爾科夫模型(HMM)方法作了較深入的討論,并在此基礎上提出了基于HMM的漢語孤立詞語音識別系統(tǒng)的設計方案。同時,編程實現了一個小詞匯量非特定人孤立詞語音識別系統(tǒng)。論文主要完成以下的工作(1)介紹了語音識別系統(tǒng)中涉及的相關概念與方法,在端點檢測中引入了功率譜熵與短時平均幅度相結合的方法,采用MFCC作為特征參數并添加動態(tài)差分參數形成一個39維的特征矢量。(2)詳細介紹了HMM的基本思想以及它在語音識別系統(tǒng)中的應用,并給出其中涉及的主要算法公式詳細推導。在此基礎上,分別對HMM的兩個模型(DHMM和CHMM)的訓練做出了詳細的描述,包括參數值的選擇與設定。并且對模型的訓練作了一些改進,來減少訓練時間。(3)采用C語言編寫了基于WIDOWS系統(tǒng)的非特定人孤立詞識別系統(tǒng)軟件,并建立了一個包括10個詞匯的語音文件與信息的語音數據庫。(4)對所設計的語音識別系統(tǒng)進行了訓練與測試,驗證了本文所提出的非特定人孤立詞識別方法的有效性,明確了進一步的改進方向。關鍵詞關鍵詞語音識別;功率譜熵;MEL倒譜系數;隱馬爾科夫模型
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數: 61
大小: 2.32(MB)
子文件數:
-
簡介:隨著電子書、電子報紙、電子郵件、辦公文件等文本電子出版物不斷涌現如何保證這些文本的正確性顯得越來越重要漢語文本自動校對系統(tǒng)的研究己成為一項亟待解決的緊迫課題本文在對目前漢語文本校對技術的深入研究和分析的基礎上在漢語文本自動校對領域進行了初步的探討在文本校對理論研究和技術實現上進行了有益的嘗試并提出了對漢語文本校對的改進方法針對標點符號錯誤的校對本文提出了以標點符號使用規(guī)則為驅動針對常見的錯誤類型在分詞和詞性標注的基礎上結合上下文信息進行查錯的方法并根據規(guī)則產生糾錯建議實驗結果顯示本文提出的這種算法可以解決大部分的標點符號錯誤并能給出正確的糾錯建議對于漢語文本查錯部分本文在歸納總結錯誤類型的基礎上對早期的查錯方法進行了改進利用漢語文字錯誤數據稀疏性的特點采用一種在大規(guī)?,F代漢語語料庫的支持下基于疑錯窗口進行查錯的方法這樣有針對性地查錯避免了大量計算降低了算法的復雜度并提高了召回率對于漢語文本糾錯部分本文充分利用漢語文本錯誤的特點對早期的糾錯建議產生算法進行了改進和擴展本文通過構造字詞混淆集、易混淆詞典對易混淆詞、別字以及多字替換等錯誤產生糾錯建議通過將教研室已有的詞典重構成按字驅動的詞典來對漏字、多字、易位等錯誤產生糾錯建議實驗結果證明該算法是一個行之有效的方法最后本文提出了這些算法在實驗系統(tǒng)中的一些不足之處以及下一步的工作方向
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 90
大?。?2.52(MB)
子文件數:
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數: 51
大?。?2.21(MB)
子文件數: