-
簡介:語音識別以語音為研究對象是語音信號處理的一個重要研究方向近二三十年來語音識別技術(shù)取得了很大的進展其產(chǎn)品也廣泛應(yīng)用于各個領(lǐng)域計算機與人類的自然交流成為語音識別技術(shù)發(fā)展的終極目標需求的迫切性也使語音識別技術(shù)得到國內(nèi)外研究機構(gòu)、廠商的廣泛重視語音識別建立在語音信號短時分析的基礎(chǔ)上利用語音信號的短時平穩(wěn)性對語音信號進行時域、頻域、倒頻域分析從而得出語音信號短時特征和短時參數(shù)1該論文提出了一種基于小波變換的語音段起止端點檢測算法傳統(tǒng)的語音段起止端點檢測算法大都是在時域上根據(jù)能量累積的大小判別語音段和噪聲段這些算法只是適用于高信噪比的情況對于低信噪比的情況這些算法往往要借助平均過零率等輔助特征這樣做不但增加了算法的復(fù)雜度而且也未必奏效該文根據(jù)小波變換的特性針對主要由白色噪聲組成的噪聲背景提出一種新的語音段起止端點檢測算法這種算法根據(jù)白色噪聲在小波變換域各個子帶的平均能量變化平緩的特點判別語音段和噪聲段實驗結(jié)果表明該論文提出的算法即使在低信噪比的情況下也能正確判別語音段和噪聲段2不論何種語言都有元音和輔音兩種音素元音為濁音輔音則可分類成清輔音和濁輔音濁音能量較大有一定的周期性清音能量較小沒有周期性但平均過零率較高對于漢語來說漢字的音節(jié)由聲母和韻母組成韻母主要表現(xiàn)為濁音的聲學(xué)特征而一部分聲母表現(xiàn)為濁音的聲學(xué)特征一部分則表現(xiàn)為清音因此如果要從一段漢語語音信號中提取單個漢字就必須區(qū)分韻母濁音和聲母濁音的不同該文通過大量的統(tǒng)計觀察和分析首次總結(jié)出一些韻母濁音和聲母濁音的聲學(xué)特征這些聲學(xué)特征對于研究語音信號中單個漢字的提取算法有著重要的參考價值
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 64
大?。?5.21(MB)
子文件數(shù):
-
簡介:該文針對非特定人命令集漢語語音識別就實用語音識別系統(tǒng)中涉及到的若干關(guān)鍵技術(shù)進行了較深入的研究和探討1在分析比較DTW和HMM兩種語音識別系統(tǒng)的基礎(chǔ)上通過改進的多段矢量量化MSVQ方法優(yōu)化模板實現(xiàn)了基于DTW的算法壓力小、模板體積小、識別性能良好的非特定人命令集語音識別系統(tǒng)2提出基于MSVQ模板的區(qū)別性訓(xùn)練方法該方法通過MCEGPD算法對模板進行優(yōu)化訓(xùn)練與盡可能精確的描述訓(xùn)練數(shù)據(jù)的不同的最大相似度訓(xùn)練相比區(qū)別性訓(xùn)練主要考慮模板的區(qū)分能力能明顯提高系統(tǒng)的識別率3該文提出基于MCEGPD算法的說話人自適應(yīng)方法它既有良好的收斂特性又能實現(xiàn)快速的自適應(yīng)4該文在背景噪聲情況下采用倒譜均衡方法進行特征補償在信道失真的情況下采用MCEGPD自適應(yīng)算法學(xué)習新環(huán)境特征自適應(yīng)調(diào)整模板參數(shù)都取得了良好的識別效果5設(shè)計了一個基于DSP的硬件系統(tǒng)用于實現(xiàn)一個實用的語音識別系統(tǒng)
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 76
大?。?1.97(MB)
子文件數(shù):
-
簡介:碩士學(xué)位論文漢語兒童英語語音意識與英語閱讀能力的相關(guān)性研究ASTUDYONTHECRELATIVITYBETWEENENGLISHPHONOLOGICALAWARENESSENGLISHREADINGABILITYAMONGCHINESECHILDREN關(guān)麗麗哈爾濱工業(yè)大學(xué)2010年6月CLASSIFIEDINDEXH3132UDC8020GRADUATIONTHESISFTHEMADEGREEASTUDYONTHECRELATIVITYBETWEENENGLISHPHONOLOGICALAWARENESSENGLISHREADINGABILITYAMONGCHINESECHILDRENCIDATEGUANLILISUPERVISPROFZHOUZHINANACADEMICDEGREEAPPLIEDFMASTEROFARTSSPECIALTYFEIGNLINGUISTICSAPPLIEDLINGUISTICSAFFILIATIONSCHOOLOFFEIGNLANGUAGESDATEOFALEXAMINATIONJUNE252010DEGREECONFERRINGINSTITUTIONHARBININSTITUTEOFTECHNOLOGY
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 80
大?。?0.59(MB)
子文件數(shù):
-
簡介:聲明本學(xué)位論文是我在導(dǎo)師的指導(dǎo)下取得的研究成果,盡我所知,在本學(xué)位論文中,除了加以標注和致謝的部分外,不包含其他人已經(jīng)發(fā)表或公布過的研究成果,也不包含我為獲得任何教育機構(gòu)的學(xué)位或?qū)W歷而使用過的材料。與我一同工作的同事對本學(xué)位論文做出的貢獻均已在論文中作了明確的說明。研究生簽名工O/Z年3月3口日學(xué)位論文使用授權(quán)聲明南京理工大學(xué)有權(quán)保存本學(xué)位論文的電子和紙質(zhì)文檔,可以借閱或上網(wǎng)公布本學(xué)位論文的部分或全部內(nèi)容,可以向有關(guān)部門或機構(gòu)送交并授權(quán)其保存、借閱或上網(wǎng)公布本學(xué)位論文的部分或全部內(nèi)容。對于保密論文,按保密的有關(guān)規(guī)定和程序處理。研究生簽名一二垂查絲2口/2年月歲口日碩士論文漢語語音合成系統(tǒng)的改進與實現(xiàn)摘要IIIII111111IIIILULIIIY2062523語音作為人機交互手段這一趨勢已經(jīng)初見倪端,語音作為人機交互手段包含兩個方面語音合成和語音識別。通常語音合成指的是文本轉(zhuǎn)語音,即把文字按語音處理規(guī)則轉(zhuǎn)換為聲音并輸出。一般來說語音合成系統(tǒng)包含三個模塊文本處理模塊、韻律處理模塊、聲音合成模塊。文本處理模塊處于語音合成系統(tǒng)的前端,其內(nèi)容有文本分詞、非標準詞正則化、字音轉(zhuǎn)換。韻律處理模塊的主要工作是從文本中提取韻律結(jié)構(gòu)、重音和語調(diào)等與韻律有關(guān)的信息。聲音合成模塊是語音合成系統(tǒng)的后端模塊,主要工作是合成聲音并對其進行修改與輸出。為了提高漢語語音合成系統(tǒng)合成語音的可懂度以及自然度,本文重點研究了文本處理模塊和韻律處理模塊,所做具體工作如下1分析了語音合成系統(tǒng)的整體框架,理解了系統(tǒng)各個模塊的主要作用以及工作原理。鑒于PSOLA在語音合成模塊中的重要作用,重點研究了PSOLA的分類以及實現(xiàn)過程,并將它應(yīng)用到語音合成原型系統(tǒng)中。2針對文本處理模塊做了研究,并對多音字處理方法做了改進與實現(xiàn)。本文一共實現(xiàn)了兩種多音字處理方法一種是靜態(tài)的依詞判音法,一種是動態(tài)的詞性規(guī)則判音法。依詞判音法是基于詞庫匹配的判音法,詞性規(guī)則判音法是基于C45的決策樹判音法。3針對韻律處理模塊做了研究,并對韻律結(jié)構(gòu)預(yù)測方法做了改進。改進后的韻律結(jié)構(gòu)預(yù)測方法用HTK對一定規(guī)模標注好的韻律詞或韻律短語的詞性詞長序列進行訓(xùn)練,得到對應(yīng)的隱馬爾科夫模型。然后用訓(xùn)練好的隱馬爾科夫模型進行韻律結(jié)構(gòu)預(yù)測。在模型訓(xùn)練過程中采用GOODTURING法對模型進行參數(shù)平滑。4搭建語音合成原型系統(tǒng),并對原型系統(tǒng)進行評測。評測數(shù)據(jù)表明本文工作的確能夠幫助提高漢語語音合成系統(tǒng)合成語音的可懂度與自然度。關(guān)鍵詞多音字韻律結(jié)構(gòu)預(yù)測決策樹隱馬爾科夫模型IIL『卜
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 72
大?。?2.77(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 42
大?。?1.63(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 132
大?。?9.09(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 61
大?。?1.79(MB)
子文件數(shù):
-
簡介:河北師范大學(xué)碩士學(xué)位論文漢語母語者與英語母語者的英語發(fā)音對比研究姓名李?,撋暾垖W(xué)位級別碩士專業(yè)英語語言文學(xué)指導(dǎo)教師潘炳信20100401VII和一個女聲;第三組,是在學(xué)習英語的中國學(xué)生中選擇有一定英語單詞和語法基礎(chǔ),但處于初級階段的非英語專業(yè)的學(xué)生。把這一階段的英語學(xué)習者作為對象,收錄隨即選擇的這兩對男、女聲閱讀這八個單詞時的語音。這里所說的,第三組中選擇的對象均是以普通話為母語的漢族學(xué)生。本文把收集到的三組數(shù)據(jù)分別放入頻譜分析儀進行分析,得到語音的持續(xù)時間和這三組的語音音質(zhì)數(shù)據(jù),著重從語音的持續(xù)時間和語音音質(zhì),以及音強三個方面對這三組語音進行對比分析。由于第一組和第二組均是有一定權(quán)威性的發(fā)音,所以,本文首先把他們放在一起,分析其異同。再將中國的英語學(xué)習者即第三組的發(fā)音,與英語朗文即第一組的英音,進行對比分析研究。根據(jù)所得數(shù)據(jù),從音質(zhì)來看,除了第二組中有幾個音的波峰變化呈上升趨勢外,其余都是下降趨勢。另外,在語音的持續(xù)時間方面,第一組和第二組基本相同,但第三組與第一組差別較大。本文主要是通過對數(shù)據(jù)的分析研究,找出中國英語初級學(xué)習者在語音學(xué)習中的差距,并為他們更好地掌握語音學(xué)習技巧,提供合理的指導(dǎo)方法。關(guān)鍵詞元音;輔音;持續(xù)時間;音質(zhì);音強;
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 62
大?。?0.98(MB)
子文件數(shù):
-
簡介:蒙太格文法是處理語法、語義和語用的典型方法尤其在語義學(xué)方面獨樹一幟該文通過對漢語語義悖認的案例分析來表明MONTAGUE文法對于自然語言處理中漢語語義分析乃至對于整個個漢語語義學(xué)的研究都具有非常重要的價值MONTAGUE的出發(fā)點是通用語法這樣的元數(shù)學(xué)概念其基本思想是邏輯語義學(xué)思想研究自然語言的工具是涵邏輯MONTAGUE文法的研究對象涵蓋了自然語言的語形學(xué)、語義學(xué)和語用學(xué)其語言研究最有特色基于PROLOG語言開發(fā)平臺開發(fā)出基于MONTAGUE文法的部分部分語句分析系統(tǒng)最后簡要介紹了蒙太格文法為基礎(chǔ)發(fā)展起來的邏輯語法并對以后的漢語語義研究前景進行了展望
下載積分: 5 賞幣
上傳時間:2024-03-11
頁數(shù): 60
大?。?1.36(MB)
子文件數(shù):
-
簡介:針對傳統(tǒng)的漢語文語轉(zhuǎn)換系統(tǒng)所存在的主要問題該文從自然語流韻律規(guī)則的總結(jié)、語料庫的設(shè)計、合成方法的研究等幾個方面入手并根據(jù)計算機技術(shù)發(fā)展的情況實現(xiàn)了一個基于語料庫的漢語文語轉(zhuǎn)換系統(tǒng)該系統(tǒng)能夠合成出具有很高自然度的語音并且保持了原始發(fā)音人的發(fā)音風格從而為漢語語音合成探索出了一條新路徑文中首先介紹了語音合成所必須涉及的語音產(chǎn)生模型然后對語音合成技術(shù)和文語轉(zhuǎn)換系統(tǒng)的歷史做了簡單回顧其中重點介紹了漢語語音合成技術(shù)所特有的一些要點以及漢語文語轉(zhuǎn)換系統(tǒng)的發(fā)展過程該文對自然語音的韻律特征進行了專門研究總結(jié)出一些韻律詞以上層次的韻律規(guī)則該文提出了一種基于境選擇單元的漢語語音合成方法根據(jù)所考慮的語境設(shè)計了一個用于合成的語料庫并將機器學(xué)習中的決策樹方法運用到漢語語音的自動韻律層次標注方面實現(xiàn)了一個基于語料庫的漢語文語轉(zhuǎn)換系統(tǒng)合成語音具有很高的自然度最后該文對系統(tǒng)所存在的問題進行了分析并展望了文語轉(zhuǎn)換系統(tǒng)的發(fā)展前景
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 66
大?。?2.86(MB)
子文件數(shù):
-
簡介:該文首先論述了語音信號生成的準穩(wěn)態(tài)模型詳細闡述了基于短時傅里葉變換進行韻律參數(shù)修改的基本步驟及其對模型參數(shù)時變進程產(chǎn)生的影響在此基礎(chǔ)上文中分別從時域和頻域研究了時間尺度修改和基音尺度修改的理論依據(jù)并采用相應(yīng)的方法在計算機中加以實現(xiàn)針對不同的結(jié)果從時域波形和頻域語音兩個角度探討不同的方法對合成信號質(zhì)量的影響最后引進國際上八十年代末出現(xiàn)的時域基音同步疊加算法結(jié)合漢語普通話的韻律特點研究一種實現(xiàn)高自然度高清晰度的漢語普通話韻律合成的方法根據(jù)合成結(jié)果分別對合成語音的質(zhì)量及該算法的韻律參數(shù)控制能力加以評價以示其有效性、實用性
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 101
大?。?3.03(MB)
子文件數(shù):
-
簡介:該文在研究了漢語的語法現(xiàn)象的基礎(chǔ)上采用基于規(guī)則的方法實現(xiàn)了機器翻譯中文分析原理系統(tǒng)RCAS的設(shè)計和開發(fā)該系統(tǒng)對已經(jīng)正確切詞的中文單名進行語法和語義相結(jié)合的分析得到準確的中間語言分析結(jié)果漢語的分析是漢外機器翻譯系統(tǒng)實現(xiàn)的基礎(chǔ)和關(guān)鍵目標語言生成所需要的所有都來自于源語言分析得到的中間語言結(jié)果漢語是一種缺少開礦高度語義化的語言漢語的名詞、開竅記號都具有多種語法功能而且漢語詞和名子的構(gòu)造規(guī)則基本相同這些都給漢語的分析帶來了困難但漢語的語法分析還有很多潛力漢語中趨向動詞的處理、多動詞謂詞識別、量詞的處理以及漢語中的一些特殊句型的處理提出了具體的解決方法該文在進一步發(fā)掘語法分析潛力的同時論述了在語法分析基礎(chǔ)上引入語義分析的必要性使用語義特征描述和語義分類相結(jié)合的語義知識表示方法提出結(jié)合對詞語配價成分的角色類型及其選擇限制的語義知識運用確定名子的語法和語義結(jié)構(gòu)
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 51
大小: 1.48(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時間:2024-03-10
頁數(shù): 69
大?。?1.98(MB)
子文件數(shù):
-
簡介:復(fù)旦大學(xué)碩士學(xué)位論文韻律信息在漢語語音識別中的應(yīng)用姓名劉丙哲申請學(xué)位級別碩士專業(yè)計算機軟件與理論指導(dǎo)教師李宗葛2002528ABSTRACTTHEGENERALGOALOFTHISTHESISISTOMODELTHEPROSODICASPECTSOFSPE。CHTOIMPROVESPEECHRECOGNITIONTOWARDSTHISGOAL,WEINVESTIGATEAVARIETYOFWAYSOFNTILIZINGPROSODICINFORMATIONTOENHANCESPEECHRECOGNITIONPERFORMANCEWEEX口10REPROSODICMODELINGINMANDARINCHINEZE,WHICHHASVERYDIFFERENTPROSODICCHARACTERISTICSWEFIRSTDEVELOPEDAPITCHDETECTIONALGORITHMAMDFNCCFANDAFORMANTDETECTIONALGORITHMFBASEDONLPC,ANDTHENWEINCORPORATEPITCHANDFORMANTINTOFEATUREVECTORINTEGRATIONOFTHEINFORMATIONINTOTHESPEECHRECOGNITIONFRAMEWORKREDUCEDTHESYLLABLEERRORRATEBYO7%FORMANDARINDIGITRECOGNITIONWEALSOEXAMINETHEDURATIONOFMANDARININITIALANDFINALANDTHEFACTORSTHATHAVEINFLUENCESONDURATIONOFSYLLABLESTHENWEDEVELOPEDADURATIONMODELFORSYLLABLEBASEDONGAUSSIANMIXTUREMODELWHICHLEADTOAO8%REDUCTIONINWORDERRORRATEINTHISTHESIS,WEMAKETHEFOLLOWINGCONTRIBUTIONSTOTHERESEARCHINTHEAREAOFPROSODICMODELING1INTEGRATIONTHEPITCHANDFORMANTINFORMATIONINTOFEATURESETFORBETTERSPEECHRECOGNITION;2ALLEMPIRICALSTUDYTHEDURATIONOFSYLLABLEINMANDARIN,WHICHINVESTIGATESTHEDISTRIBUTIONOFSYLLABLEDURATIONSANDTHEFACTORSTHATINFLUENCEDURATIONS;3ANOVELDURATIONMODELWHICHBASEDONGAUSSIANMIXTUREMODELKEYWORDSPROSODY,SPEECHRECOGNITIONPITCH,F(xiàn)ORMANT,DURATION
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 54
大小: 1.46(MB)
子文件數(shù):
-
簡介:隨著現(xiàn)代化信息技術(shù)的不斷發(fā)展,計算機的數(shù)量快速增加,互聯(lián)網(wǎng)內(nèi)的信息量極速膨脹,計算機技術(shù)已經(jīng)和人們的日常生活息息相關(guān)。自然語言處理是計算機科學(xué)領(lǐng)域一個重要的研究課題,它的研究對象是人們?nèi)粘J褂玫恼Z言,通過對自然語言的研究和處理,實現(xiàn)自然語言和計算機之間的互相理解和正常通信。詞法分析是自然語言處理領(lǐng)域一個重要的問題,大部分機器翻譯的問題都需要進行詞法分析。目前,對于詞法分析的研究和實現(xiàn)大都局限在實驗層次,而辦公移動化、資源共享化的互聯(lián)網(wǎng)環(huán)境決定了一個在線共享的實用性平臺更具有現(xiàn)實意義?;ヂ?lián)網(wǎng)上也已經(jīng)出現(xiàn)了一些實用性的詞法分析平臺,能夠?qū)崿F(xiàn)基本的分詞和詞性標注的功能,但由于源碼不可修改、詞性標注集不同等原因,無法為今后的相關(guān)性研究工作提供支持。本文在實驗室研究的基礎(chǔ)上,結(jié)合實驗室的分詞和詞性標注源碼,獨立開發(fā)了一個詞法分析的平臺。在平臺中,加入了人工干預(yù)的部分,用戶可以對分詞結(jié)果進行修正,系統(tǒng)會定時地啟動線程對修正的結(jié)果掃描,找到修正結(jié)果中含有的新詞用來擴充新詞詞典。對于每個用戶,還可以申請臨時詞典,將需要使用的新詞添加到臨時詞典中,暫時性地自定義分詞結(jié)果。用戶在提交分詞請求的時候,可以選擇原始分詞、使用新詞詞典分詞和使用臨時詞典分詞等多種分詞方式。詞性標注方面,用戶可以對句直接標注,也可以使用分詞的結(jié)果進行標注,修正的詞性標注的結(jié)果也可以為今后的標注效果的提高提供數(shù)據(jù)依據(jù)。本文通過小概率事件置入的規(guī)則,彌補了統(tǒng)計方法上的局限性,使得統(tǒng)計和規(guī)則更好地融合,接口的公開化也方便了功能調(diào)用。平臺中還加入了權(quán)限管理、工具下載和工作量統(tǒng)計等模塊,后臺服務(wù)器開發(fā)選用J2EE的SSM框架,數(shù)據(jù)庫采用MYSQL,服務(wù)器環(huán)境UBUNTU。
下載積分: 5 賞幣
上傳時間:2024-03-09
頁數(shù): 59
大小: 5.92(MB)
子文件數(shù):