眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認知 防護手冊 復(fù)工復(fù)產(chǎn) 應(yīng)急預(yù)案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計 畢業(yè)論文 開題報告 文獻綜述 任務(wù)書 課程設(shè)計 相關(guān)資料 大學(xué)生活 期刊論文 實習(xí)報告
  • 項目策劃 >
    項目策劃
    土地準備 規(guī)劃設(shè)計 開工開盤 項目綜合 竣工移交 售后移交 智慧方案 安全專項 環(huán)境影響評估報告 可行性研究報告 項目建議書 商業(yè)計劃書 危害評估防治 招投標(biāo)文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學(xué) 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗 行政人力 企業(yè)管理 醫(yī)學(xué)衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財會稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報 調(diào)研報告 工作計劃 述職報告 講話發(fā)言 心得體會 思想?yún)R報 事務(wù)文書 合同協(xié)議 活動策劃 代理加盟 技術(shù)服務(wù) 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團工作 民主生活
  • 學(xué)術(shù)文檔 >
    學(xué)術(shù)文檔
    自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、 交通運輸 經(jīng)濟 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
  • 經(jīng)營營銷 >
    經(jīng)營營銷
    綜合文檔 經(jīng)濟財稅 人力資源 運營管理 企業(yè)管理 內(nèi)控風(fēng)控 地產(chǎn)策劃
  • 教學(xué)課件 >
    教學(xué)課件
    幼兒教育 小學(xué)教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習(xí)題 課后答案 綜合教學(xué)
  • 土木建筑 >
    土木建筑
    專項施工 應(yīng)急預(yù)案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導(dǎo)學(xué) >
    課程導(dǎo)學(xué)
    醫(yī)學(xué)綜合 中醫(yī)養(yǎng)生 醫(yī)學(xué)研究 身心發(fā)展 醫(yī)學(xué)試題 影像醫(yī)學(xué) 醫(yī)院辦公 外科醫(yī)學(xué) 老年醫(yī)學(xué) 內(nèi)科醫(yī)學(xué) 婦產(chǎn)科 神經(jīng)科 醫(yī)學(xué)課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學(xué) 康復(fù)醫(yī)學(xué) 全科醫(yī)學(xué) 護理學(xué)科 針灸學(xué)科 重癥學(xué)科 病毒學(xué)科 獸醫(yī) 藥學(xué)
  • 資源分類:
    全部 抗擊疫情 成品畢設(shè) 項目策劃 專業(yè)資料 共享辦公 學(xué)術(shù)文檔 經(jīng)營營銷 教學(xué)課件 土木建筑 課程導(dǎo)學(xué)
    二級分類:
    全部 自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、體育 交通運輸 經(jīng)濟 語言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書 哲學(xué)宗教
    三級分類:
    全部 語言、文字 醫(yī)學(xué)、衛(wèi)生 工業(yè)技術(shù) 數(shù)理科學(xué)和化學(xué) 農(nóng)業(yè)科學(xué) 政學(xué) 環(huán)境科學(xué)、安全科學(xué) 歷史、地理 天文學(xué)、地球科學(xué) 社會科學(xué)總論 生物科學(xué) 哲學(xué)、宗教 交通運輸 綜合性圖書 哲學(xué) 軍事 自然科學(xué)總論 經(jīng)濟 文化、科學(xué)、教育、體育 藝術(shù) 文學(xué) 航空、航天
    四級分類:
    全部 常用外國語 語言學(xué) 漢語 印歐語系
    上傳類型:
    全部 互聯(lián)網(wǎng)共享 作者原創(chuàng) 獨家資料
    資源格式:
    不限 doc ppt pdf 圖片 flash 視頻 音頻 壓縮包
    上架時間:
    不限 三天內(nèi) 一周內(nèi) 一個月內(nèi) 一年內(nèi)
    特色搜索:
    不限 文件包巨大 瀏覽量超巨 購買量排行 子文件超多好評如潮
    • 簡介:作為自然語言理解的一項基礎(chǔ)工作,詞語語義相似度度量一直是研究的重點。語義相似度度量本身是一個中間任務(wù),它是大多數(shù)自然語言處理任務(wù)中一個必不可少的中間層次,在自然語言處理中有著廣泛的應(yīng)用,如詞義消歧、信息檢索以及機器翻譯等。本文的核心內(nèi)容是漢語詞語語義相似度算法研究以及如何將其應(yīng)用于跨語言信息檢索CROSSLANGUAGEINFMATIONRETRIEVAL,CLIR領(lǐng)域。本文首先對語義相似度度量算法進行綜述,然后重點描述基于HOW的語義相似度度量算法,提出根據(jù)知識詞典描述語言KNOWLEDGEDICTIONARYMARKUPLANGUAGE,KDML的結(jié)構(gòu)特性將詞語語義相似度分為三部分進行計算,每部分采用最大匹配的算法,同時加入義原深度信息以區(qū)別對待不同信息含量的義原。較以往同類算法,其計算結(jié)果具有區(qū)分度,更加符合人的主觀感覺。本文嘗試將所建立的漢語語義相似度度量模式應(yīng)用于跨語言信息檢索系統(tǒng)??缯Z言信息檢索結(jié)合傳統(tǒng)文本信息檢索技術(shù)和機器翻譯技術(shù),在多方面涉及到語義問題,是語義相似度良好的切入點。兩者的結(jié)合主要體現(xiàn)在兩方面1將語義相似度度量應(yīng)用于查詢翻譯,利用語義相似度對查詢關(guān)鍵詞進行消歧翻譯,提高翻譯質(zhì)量;2將語義相似度應(yīng)用于查詢擴展,使擴展內(nèi)容與原查詢具有更高相關(guān)性,以提高檢索的召回率和準確率。本文提出相對客觀的評價標(biāo)準,如為單獨衡量詞義消歧的性能,而使用第三屆詞義消歧系統(tǒng)評價會議THE3RDEVALUATINGWDSENSEDISAMBIGUATIONSYSTEMS,SENSEVAL3語料進行測試;為衡量應(yīng)用語義相似度于跨語言檢索后的性能,又使用第九屆文本檢索會議THE9THTEXTRETRIEVALCONFERENCE,TREC9CLIR評價任務(wù)的查詢集、語料庫和結(jié)果集進行評估。這使得我們的實驗結(jié)果相對公正客觀,具有一定可比性。本文對原有英漢跨語言信息檢索系統(tǒng)進行一定程度的改進,使得各種相關(guān)算法都可方便地在系統(tǒng)中進行集成,成為一個研究跨語言信息檢索的實驗平臺,其系統(tǒng)的設(shè)計思想充分體現(xiàn)模塊化和擴展性。綜上,本文通過綜合分析主流的語義相似度算法,而提出一種新的基于HOW的漢語語義相似度算法,并給出其在英漢跨語言信息檢索中的嘗試性應(yīng)用,希望能給相關(guān)領(lǐng)域的研究者有所借鑒。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 58
      6人已閱讀
      ( 4 星級)
    • 簡介:隨著信息時代的到來網(wǎng)絡(luò)在人們生活中的重要性越來越大。而不管網(wǎng)絡(luò)中各種技術(shù)怎樣革新人們都需要從海量數(shù)據(jù)里面找到自己所需要的信息。由此可見無論技術(shù)怎樣進步搜索引擎的重要性都不會改變。目前傳統(tǒng)的搜索引擎大多基于關(guān)鍵字查詢對于用戶輸入的復(fù)合結(jié)構(gòu)會被視作離散的字符串集把原本完整的復(fù)合結(jié)構(gòu)打碎成孤立的單詞。用戶的需求也被割裂從而導(dǎo)致準確率的下降。這是本文的應(yīng)用背景及研究起始點。另一方面在自然語言處理中復(fù)合結(jié)構(gòu)也普遍出現(xiàn)因此尋找適合對復(fù)合結(jié)構(gòu)進行語義解釋的理論和方法具有重要的理論研究意義和廣闊的應(yīng)用價值。目前對于漢語復(fù)合結(jié)構(gòu)概念圖的標(biāo)引已經(jīng)基本成熟但大部分都是通過手工來完成對于浩瀚的漢語復(fù)合結(jié)構(gòu)而言單純采用手工標(biāo)引基本無法完成。因此如果能夠在復(fù)合結(jié)構(gòu)原子概念圖的基礎(chǔ)上探究到原子概念圖的復(fù)合運算那么對于真正實現(xiàn)通過漢語復(fù)合結(jié)構(gòu)概念圖的方式提高搜索精度會有一定的貢獻。本文研究的是漢語復(fù)合結(jié)構(gòu)的概念圖復(fù)合運算復(fù)合結(jié)構(gòu)是由兩個或兩個以上的詞直接組合而成。復(fù)合結(jié)構(gòu)的概念圖是指利用概念圖的方式來表示漢語的整個復(fù)合結(jié)構(gòu)。本文的研究從實例分析出發(fā)嘗試在內(nèi)涵邏輯模型下探究復(fù)合結(jié)構(gòu)詞與詞之間的可能存在的關(guān)系以及之間可能存在的操作從而探究復(fù)合結(jié)構(gòu)中詞與詞之間可能存在的概念圖復(fù)合運算。本文的主要工作為通過分析用戶查詢?nèi)罩局械膹?fù)合結(jié)構(gòu)為復(fù)合結(jié)構(gòu)中原子概念建立原子概念圖庫然后通過對于漢語復(fù)合結(jié)構(gòu)的預(yù)處理定義復(fù)合結(jié)構(gòu)詞與詞之間概念圖的復(fù)合運算。其中主要的運算方式有3種填值運算添加屬性名和屬性值對運算抑制屬性名和屬性值對運算。從語義語法角度分為修飾關(guān)系和聯(lián)合關(guān)系。其中修飾關(guān)系包括鄰近詞復(fù)合運算跨詞復(fù)合運算未登錄詞運算借代修辭運算。聯(lián)合關(guān)系包括多中心概念運算。本文的創(chuàng)新性工作主要有以下方面1打開單個概念的內(nèi)涵邏輯用LT;EAVGT;的方法表示概念的內(nèi)涵邏輯。從而從深層語義上挖據(jù)詞語的內(nèi)涵達到深層次挖掘詞語內(nèi)涵邏輯的目的。2通過分析漢語復(fù)合結(jié)構(gòu)詞與詞之間的各種關(guān)系提出了漢語復(fù)合結(jié)構(gòu)詞之間的各種運算從而在一定程度上可以達到自動生成漢語復(fù)合結(jié)構(gòu)概念圖的目的。對于搜索引擎的語義查詢有一定的幫助從而有可能提高搜索的精度。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 70
      14人已閱讀
      ( 4 星級)
    • 簡介:關(guān)鍵詞識別是語音識別研究中的一個重要領(lǐng)域其目的是從連續(xù)語音中檢測并確認給定的若干個特定關(guān)鍵詞跟關(guān)鍵詞識別相比目前連續(xù)語音識別有資源耗費大速度慢抗噪能力不強等缺點這是連續(xù)語音識別短期內(nèi)難以突破的問題所在而關(guān)鍵詞識別允許在嘈雜的環(huán)境中使用因此在當(dāng)前技術(shù)水平下許多應(yīng)用領(lǐng)域不適合連續(xù)語音識別而要求關(guān)鍵詞識別這一課題的研究如能取得突破性進展則將大大有助于拓寬語音識別系統(tǒng)的應(yīng)用領(lǐng)域而信息檢索顯然是一個有很好應(yīng)用前景的領(lǐng)域本文主要內(nèi)容是關(guān)鍵詞識別技術(shù)及語音檢索系統(tǒng)研究與實現(xiàn)提供了一個性能優(yōu)良的關(guān)鍵詞識別引擎通過系統(tǒng)測試在正確率為821%的情況下召回率達到884%并在此引擎基礎(chǔ)上開發(fā)了面向特定網(wǎng)站的語音檢索系統(tǒng)SAS和基于P2P架構(gòu)的語音檢索平臺對關(guān)鍵詞識別的一些方法做了改進以獲取良好的關(guān)鍵詞識別正確率和較低的虛報指數(shù)
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 70
      8人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 61
      4人已閱讀
      ( 4 星級)
    • 簡介:在自然語言理解方面符號主義與聯(lián)接主義目前都相繼遇到了巨大的障礙在這種情況下一種非常自然的考慮就是能否將兩者結(jié)合在一起來擺脫目前自然語言研究的困境而語義神經(jīng)網(wǎng)絡(luò)就是這樣一種思想方法它打破傳統(tǒng)的基于規(guī)則的線性的理解模式把自然語言理解過程看成是語言文字信號在人腦中激活相應(yīng)的神經(jīng)元并建立激活語義神經(jīng)網(wǎng)絡(luò)的過程如能實現(xiàn)這一思想其意義是不言而喻的但目前其研究工作才剛剛起步研究者們還僅僅只給出了構(gòu)思和模型另外一方面漢語的機器理解一直都是難點無論是規(guī)則法還是統(tǒng)計法都未針對漢語的特點系統(tǒng)地提出一套分析方法我們發(fā)現(xiàn)語義神經(jīng)網(wǎng)絡(luò)以語義分析為主這正好符合漢語作為分析型語言的特點它語義神經(jīng)網(wǎng)絡(luò)以概念之間的語義關(guān)系為依托這又能很好地解決漢語語義上的模糊性和詞性劃分上的困難問題故本文的工作就是模擬并初步實現(xiàn)這個語義神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)漢語表層語義的理解我們在文中設(shè)計了語義神經(jīng)網(wǎng)絡(luò)神經(jīng)元的模型給出了神經(jīng)元的結(jié)構(gòu)、方法的定義和描述并對漢語表層語義關(guān)系進行了初步的分析同時創(chuàng)建了概念本體庫給出了概念本體的定義以及描述建立了它與神經(jīng)元的映射關(guān)系并在此基礎(chǔ)上引入?yún)f(xié)商機制來保證神經(jīng)元之間有序地進行自主連接定義了協(xié)商模型和協(xié)商語言給出了SNN的協(xié)商算法由此自然語言理解過程就是嵌套本體知識的神經(jīng)元通過相互通訊和協(xié)商達成一定的協(xié)議并產(chǎn)生相應(yīng)動作的過程最后本文做了部分句型的試驗結(jié)果顯示用語義神經(jīng)網(wǎng)絡(luò)用于自然語言理解是基本可行的
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 57
      6人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 37
      5人已閱讀
      ( 4 星級)
    • 簡介:人工耳蝸是目前唯一能使重度耳聾者重獲聽力的醫(yī)學(xué)假體隨著集成電路和語音處理技術(shù)的飛速發(fā)展人工耳蝸的性能也在逐步提高和完善為耳聾患者獲得更多質(zhì)量更好的聽覺感受提供了可能。人工耳蝸是將語音信號通過體外語音處理器編碼后發(fā)送脈沖到耳蝸內(nèi)的植入電極通過電刺激聽神經(jīng)代替耳聾者受損的毛細胞產(chǎn)生聽覺。關(guān)于人工耳蝸的研究國外已經(jīng)有較為成熟的理論基礎(chǔ)和臨床經(jīng)驗近年來隨著經(jīng)濟發(fā)展我國聽障人士也開始受益于人工耳蝸對聽力的幫助。然而國外的研究經(jīng)驗和成果對我國人工耳蝸的發(fā)展并不完全適用漢語的聲調(diào)特性對語義的影響至關(guān)重要這使得在我國人工耳蝸在編碼處理上的難度要遠大于西方發(fā)達國家。而在人工耳蝸植入者的日常生活中除了人工耳蝸本身性能之外影響語音感知能力另外一個不可避免的干擾便是噪聲。因此研究人工耳蝸患者的漢語可懂度的影響因素和患者的發(fā)聲能力對于人工耳蝸在我國的發(fā)展和改進有重要的指導(dǎo)意義。本文對我國人工耳蝸植入者的漢語聲調(diào)識別能力和發(fā)聲能力進行了分析研究這對改進人工耳蝸性能及提高植入者生活質(zhì)量具有較大參考價值。論文對漢語語音、聲調(diào)識別及發(fā)聲能力的影響因素進行了分析并對包含大量聲調(diào)信息的基頻提取方法做出改進以更好的得到和分析人工耳蝸植入的聲調(diào)認知能力。首先對噪聲環(huán)境下人工耳蝸語音可懂度的影響因素進行了仿真實驗將語音信號進行人工耳蝸編碼仿真處理后再合成采用正常聽力被試者進行測聽。在不同的信噪比和刺激衰減速率下本次實驗研究分析了刺激擴散衰減速率對噪聲環(huán)境下語音可懂度以及聲調(diào)識別的影響。其次對語音信號的基頻提取方法進行改進將包含大量聲調(diào)信息的基頻檢測作為判別聲調(diào)特征的主要手段。本文在經(jīng)典的基頻提取方法的基礎(chǔ)上提出了兩種改進的基音周期檢測方法第一種方法結(jié)合平均能量幅度差函數(shù)AMDF和自相關(guān)函數(shù)ACF使基頻周期處的峰值點更為突出尖銳提高了基頻檢測的抗噪性第二種方法通過線性殘差LPC系數(shù)構(gòu)成的逆濾波器對語音信號的逆濾波去除聲道響應(yīng)和噪聲干擾再對殘差信號進行倒譜法檢測語音周期。最后對人工耳蝸植入兒童的聲調(diào)發(fā)聲能力進行了客觀評估評價標(biāo)準為語音質(zhì)量評估算法PESQ的得分和發(fā)聲材料的基頻特征。通過人工耳蝸植入兒童發(fā)聲錄音實驗的數(shù)據(jù)處理對四個聲調(diào)發(fā)聲的語音質(zhì)量及各自的基頻特點和常見錯誤進行了的分析。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 58
      3人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 51
      12人已閱讀
      ( 4 星級)
    • 簡介:語音關(guān)鍵詞檢測SPOKENTERMDETECTIONSTD是指用戶提供文本形式的查詢請求系統(tǒng)從語音資源庫中返回與用戶查詢相關(guān)的語音片段。它是語音識別的一個重要領(lǐng)域有著廣闊的應(yīng)用前景。語音關(guān)鍵詞檢測系統(tǒng)一般分離線建立索引和在線檢測結(jié)果兩個階段質(zhì)量好的索引往往能提高系統(tǒng)檢測的準確性。在實際的系統(tǒng)中通?;谡Z音識別的結(jié)果為語音資源庫建立索引。由于LATTICE有著結(jié)構(gòu)合理、信息含量豐富的優(yōu)點目前大多數(shù)語音關(guān)鍵詞檢測系統(tǒng)都是基于LATTICE建立索引的。LATTICE本身包含了聲學(xué)似然比和語言模型概率因此可以很方便的獲得LATTICE中局部路徑的后驗概率將其作為局部路徑的置信測度是建立索引的一種簡單有效的方法。但是傳統(tǒng)的N元文法模型如二元文法即BIGRAM模型沒有考慮當(dāng)前觀測詞和與其相隔一定距離的詞間的相關(guān)性信息因而存在一定的信息丟失。本文利用長距離的BIGRAM模型能夠從不同的層次表達單詞之間的語法和語義信息基于LATTICE圖形結(jié)構(gòu)和長距離的BIGRAM模型而不是傳統(tǒng)N元文法模型建立索引將會改善索引的質(zhì)量和系統(tǒng)的檢測性能。本文考察了基于不同距離BIGRAM模型的語音關(guān)鍵詞檢測系統(tǒng)的性能結(jié)果表明整合多種距離長距離BIGRAM模型語音關(guān)鍵詞檢測系統(tǒng)的檢測結(jié)果能夠獲得比基于傳統(tǒng)NGRAM模型的語音關(guān)鍵詞檢測系統(tǒng)更高的識別召回率。在面向新聞數(shù)據(jù)庫的語音關(guān)鍵詞檢測系統(tǒng)中新聞?wù)Z音數(shù)據(jù)是構(gòu)建語音識別器的理想語料。在語音關(guān)鍵詞檢測系統(tǒng)的前端需要構(gòu)建語音識別器將語音資源轉(zhuǎn)化為文本表示。但是目前的商業(yè)新聞?wù)Z料普遍存在標(biāo)注不夠精細的問題標(biāo)注是段落級而非語句級因此不能直接用來完成語音識別的相關(guān)任務(wù)。本文提出了一種基于語音識別技術(shù)的自動切分新聞?wù)Z料的方法。該方法構(gòu)建線性的識別網(wǎng)絡(luò)并在句間添加可選的靜音模型對不夠精細的語音段進行解碼之后根據(jù)語音幀在靜音模型上是否駐留以及駐留時間的長短來判斷是否需要對段落級的語音進行切分。實驗表明本方法在語料時長低于11分鐘的情況下具有較好的性能。因此該方法是對段落級的語音進行精細加工的一種有效方法。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 58
      3人已閱讀
      ( 4 星級)
    • 簡介:本文對漢語動賓搭配及其語義關(guān)系標(biāo)注等技術(shù)作了較為深入的研究。整理并修訂了動賓搭配庫的設(shè)計原則和基本框架,并初步建成了具有一定規(guī)模的動賓搭配庫。本文的主要工作及主要結(jié)論如下1提出了一種基于條件隨機場的類層疊算法識別動賓搭配,利用該方法層疊刪除最里層搭配,解決了多嵌套形式的搭配難以識別的問題,取得了良好的效果。2以朱德熙、呂叔湘、丁樹聲,呂冀平等語言學(xué)大家對語義關(guān)系的論證為依據(jù),以HOW語義知識庫資源為依托,通過對從大規(guī)模語料中抽取的動賓搭配進行人工語義關(guān)系劃分,經(jīng)過反復(fù)修改最終歸納出二十種動賓搭配語義關(guān)系類型。3利用正交策略對特征模板進行組合優(yōu)化,自動標(biāo)注動賓語義關(guān)系類型。并且嘗試無上下文的動賓搭配語義關(guān)系的自動標(biāo)注研究。4設(shè)計并實現(xiàn)搭配庫構(gòu)建平臺,采用人機互助的方式構(gòu)建一個具有11萬搭配并帶有語義關(guān)系標(biāo)注和語義信息的搭配庫。隨著語義研究的日益深入,自然語言理解已經(jīng)成為NLP領(lǐng)域的一種理想境界。缺乏語義知識、語法知識、詞匯搭配等知識,自然語言理解好比是“無源之水,無本之木”,因此,本文的課題作為一項基礎(chǔ)研究工程,有很好的應(yīng)用前景。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 62
      5人已閱讀
      ( 4 星級)
    • 簡介:對于句子進行分析通常要滿足句子分析的功能和意義兩個標(biāo)準。滿足這兩條標(biāo)準通常要求對句子進行淺層的分析同時也要對句子進行深層的分析。漢語作為世界上使用人數(shù)最多的語言對于漢語句子的分析也就顯得尤為重要。本論文對漢語句子分析的一些關(guān)鍵技術(shù)進行了研究。對于句子采用依存語法體系進行句法分析然后在構(gòu)建的語義依存模式樹庫基礎(chǔ)上通過基于DEF樹形態(tài)相似度的詞語相似度計算方法計算模糊匹配度使用一種改進的有序模糊匹配的方法進行語義的分析從而最終得到漢語句子全面的分析結(jié)果。本文的核心工作可以概括為以下幾個方面第一對于漢語句子分詞技術(shù)的研究。提出了一種融合神經(jīng)網(wǎng)絡(luò)和匹分詞技術(shù)。神經(jīng)網(wǎng)絡(luò)具有良好的容錯性、自組織和自學(xué)習(xí)的能力本文使用反向傳播神經(jīng)網(wǎng)絡(luò)以及匹配融合的分詞方法既利用了神經(jīng)網(wǎng)絡(luò)的容錯性特點又利用了傳統(tǒng)匹配方法的優(yōu)勢對二者的融合進行了探索。第二對于漢語詞語的相似度計算的研究。提出了一種基于DEF樹形態(tài)相似度的詞語相似度計算方法并且結(jié)合基于馬科夫的相似度計算方法。本方法充分利用了樹的形態(tài)相似性能夠深層次挖掘詞語的語義相似性并通過對比實驗和同義詞林的近義詞相似性計算實驗表明了方法的有效性和優(yōu)勢。第三對于語義表示的形式化研究。利用知網(wǎng)和信息結(jié)構(gòu)庫構(gòu)建語義依存模式樹庫將簡單的文本描述的語義知識形式化并且成為便于計算機處理的形式。同時還對于構(gòu)建的語義依存模式樹庫進行補充和完善。第四對于語義分析方法的研究。在依存句法分析的基礎(chǔ)上使用一種改進的有序模糊匹配方法在語義確定過程中使用到詞語相似度進行模糊匹配度的計算。結(jié)果表明這是一種有效的語義分析方法。第五對于分析結(jié)果的整合的研究。將漢語句子分析結(jié)果向RELEX靠攏以期用于機器人系統(tǒng)中去。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 110
      5人已閱讀
      ( 4 星級)
    • 簡介:該文介紹的是一個基于DSP的硬件非特定人命令集語音識別系統(tǒng)的設(shè)計與實現(xiàn)為了整個硬件系統(tǒng)的順利實現(xiàn)首先我們對整個語音識別系統(tǒng)的各項關(guān)鍵技術(shù)在PC上做了仿真實現(xiàn)、測試和優(yōu)化然后在TI公司成熟的DSP評測板卡上實現(xiàn)了整個系統(tǒng)最后根據(jù)實際應(yīng)用設(shè)計并實現(xiàn)了基于DSP的語音識別系統(tǒng)該文對算法研究和硬件實現(xiàn)中采用的技術(shù)做了詳細分析和討論1對經(jīng)典的小詞匯量語音識別系統(tǒng)的算法進行了充分討論2針對經(jīng)典算法測試結(jié)果顯示出的不足論文對經(jīng)典的識別算法做了修改3在TI的TMS320VC5402DSK上實現(xiàn)了語音識別系統(tǒng)4根據(jù)實際的應(yīng)用需要設(shè)計與實現(xiàn)了一個基于DSP的語音識別系統(tǒng)完成了初步的性能測試
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 77
      9人已閱讀
      ( 4 星級)
    • 簡介:太原理工大學(xué)碩士學(xué)位論文基于SPHINX的漢語連續(xù)語音識別姓名王韻申請學(xué)位級別碩士專業(yè)指導(dǎo)教師張雪英太原理工大學(xué)碩士研究生學(xué)位論文II據(jù)分析,驗證了系統(tǒng)的有效性。本文主要進行了兩個系統(tǒng)的設(shè)計首先以CASIA漢語數(shù)字串語音庫訓(xùn)練聲學(xué)模型和語言模型,構(gòu)建了漢語連續(xù)數(shù)字識別系統(tǒng),該系統(tǒng)句子識別率達到了90,詞識別率高達972;其次以CASIA9899語音測試庫訓(xùn)練聲學(xué)模型和語言模型,建立了一個中等詞匯量的漢語連續(xù)語音識別系統(tǒng),該系統(tǒng)性能較之前者識別性能欠佳,句識別率為70,詞識別率為967。全部數(shù)據(jù)顯示了系統(tǒng)的有效性。關(guān)鍵詞漢語連續(xù)語音識別,SPHINX,特征提取,聲學(xué)模型,語言模型,搜索算法
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 69
      7人已閱讀
      ( 4 星級)
    • 簡介:隨著近幾年互聯(lián)網(wǎng)的飛速發(fā)展網(wǎng)絡(luò)中各種各樣的電子文本信息急劇膨脹。如何迅速、有效地從這些海量的、非結(jié)構(gòu)化的文本中獲取我們所需要的信息和知識已經(jīng)成為自然語言處理領(lǐng)域的一個研究熱點。作為信息抽取的重要子任務(wù)命名實體識別在許多自然語言處理應(yīng)用領(lǐng)域起著十分重要的作用其主要目的是識別文本或句子中表示人名、地名、機構(gòu)名以及時間日期等信息的短語。本文引入實體語素概念在機器學(xué)習(xí)框架融合實體內(nèi)部結(jié)構(gòu)特征和外部上下文信息研究人名、地名和機構(gòu)名等命名實體識別方法重點解決地名和機構(gòu)名當(dāng)中存在的大量復(fù)雜的、含有嵌套結(jié)構(gòu)的命名實體識別問題。具體地本文從以下三個方面展開研究首先采用基于機器學(xué)習(xí)方法構(gòu)建漢語命名實體的雙層模型并通過實驗對最大熵和條件隨機場組合成的四種雙層模型進行了對比測試。結(jié)果表明基于條件隨機場的雙層模型對嵌套命名實體的識別效果最好。在此基礎(chǔ)上對雙層模型的錯誤識別結(jié)果進行了分析進而提出一種基于互信息的后處理方法對復(fù)雜的命名實體進行糾錯處理很大程度上解決了嵌套命名實體邊界識別錯誤問題。其次將非嵌套的簡單實體和嵌套的復(fù)雜實體分開分別處理同時以字和詞相結(jié)合的方式深入剖析多層嵌套命名實體的結(jié)構(gòu)特點并以此為基礎(chǔ)改進基于條件隨機場的雙層模型結(jié)構(gòu)以進一步提高嵌套命名實體識別效果。最后通過語料庫考察了漢語嵌套命名實體與實體語素之間的關(guān)系并以命名實體語素為基礎(chǔ)通過LOGISTIC回歸模型中LOGISTIC變換方法篩選出的嵌套命名實體內(nèi)部的多級前后綴語素特征進而在條件隨機場模型上融合內(nèi)部結(jié)構(gòu)特征和外部上下文信息實現(xiàn)了一個基于實體語素的漢語嵌套命名實體識別系統(tǒng)。實驗結(jié)果表明命名實體語素的引入有利于提高嵌套命名實體識別的性能。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 78
      8人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 65
      23人已閱讀
      ( 4 星級)
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機械圖紙源碼,實習(xí)報告等文檔下載

    備案號:浙ICP備20018660號