

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、經(jīng)典的機器學習算法大都是針對特定數(shù)據(jù)類型設計的,例如,ID3算法適用于離散型數(shù)據(jù)、BP算法適用于連續(xù)型數(shù)據(jù)。而在實際的學習問題中,學習數(shù)據(jù)與學習算法不匹配的情形不可避免地經(jīng)常出現(xiàn)。通常的解決方案是通過屬性轉(zhuǎn)換使數(shù)據(jù)與算法的類型一致,這一模式被稱為“面向算法的學習”(Algorithm Oriented Learning,AOL)。然而,實驗表明AOL并不是一種有效的學習模式,一些重要的數(shù)據(jù)信息可能會在屬性轉(zhuǎn)換中被破壞,進而影響學習的效果
2、。
本文以基于結構的屬性分類和算法分類觀點,深入分析了信息在屬性轉(zhuǎn)換中損失的本質(zhì),并在此基礎上提出了“面向結構的學習”(Structure Oriented Learning,SOL),該模式引入了具有一定結構復雜性的中間結構,并以此作為聯(lián)系數(shù)據(jù)與算法的紐帶--SOL要求數(shù)據(jù)和算法都轉(zhuǎn)換成與中間結構一致的類型。
中間結構的選擇在SOL模式中是非常重要的。中間結構必須有一定的普遍性,使其能定義在大多數(shù)的屬性集合
3、上;又必須有一定的描述力,使其能對其他結構進行合理的解釋?!案瘛闭沁@樣一個合適的、具有一定結構復雜度的、既簡單又復雜的結構。
本文主題就是以“格”為中間結構的機器學習。
在討論具體的“面向格的機器學習”實例之前,本文梳理了“學習”的一般過程,提出了“機器學習機”的六元組表示,并在此基礎上給出了“學習”相關概念的形式化定義。
至此,本文的前半部分回答了以下三個問題,“什么是學習?”,“什么是面向
4、結構的學習?”,“什么是面向格的學習?”。
而本文的后半部分則回答了“怎樣進行面向格的學習?”,這里討論了兩個“面向格的機器學習”的實例。
本文討論的第一個實例是基于格的規(guī)則歸納。本文首先提出了基于認知的帶例外規(guī)則(rule with exception,RE)學習框架--CBREL,以及該框架下的CBREL-CBL算法和CBREL-ID3算法;接著,通過兩種不同的方法分別將兩個算法轉(zhuǎn)換為SOL模式下“格”類
5、算法,最后,本文通過大量實驗比較了AOL模式與SOL模式運用于混合類型數(shù)據(jù)分類問題的學習效果。實驗結果表明,“格嵌入+格算法”的分類結果明顯好于“離散化+離散型算法”的分類結果,而沒有表現(xiàn)出對“連續(xù)化+連續(xù)型算法”的優(yōu)勢。分析認為離散化是復雜結構向簡單結構的轉(zhuǎn)換,這一過程存在信息損失;連續(xù)化是簡單結構向復雜結構的轉(zhuǎn)換,這一過程沒有信息損失。以上結論也驗證了本文提出的關于信息損失因為的觀點。
本文討論的第二個實例是基于半格的
6、LDA類模型學習。LDA是應用于語料的主題模型,它將主題表示為詞上的一種分布,而文檔則是各種主題的隨機混合。LDA類模型是LDA模型及其變形的統(tǒng)稱。LDA類模型一般適用于未標注的語料(unannotated corpus),此時,模型的訓練過程可以被看作是離散型數(shù)據(jù)上的聚類過程。本文討論了如何在面向半格的學習模式下,將LDA類模型運用于由分析樹屬性(parser tree attribute)構成的標注語料(annotated corp
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機器學習的拓撲結構研究.pdf
- 面向異源數(shù)據(jù)的機器學習算法研究.pdf
- 面向最優(yōu)養(yǎng)殖布局的機器學習方法.pdf
- 面向疾病智能診斷的機器學習方法研究.pdf
- 面向機器學習方法的命名實體識別.pdf
- 面向?qū)ο蟾拍罡衽c面向?qū)傩愿拍罡竦膶傩约s簡理論.pdf
- 面向健康評估的機器學習方法研究與應用.pdf
- 面向文本組塊獲取的機器學習方法的研究.pdf
- 面向統(tǒng)計機器翻譯的結構對齊及結構轉(zhuǎn)換技術研究.pdf
- 面向圖像語義提取的判別結構學習.pdf
- 基于機器學習的空軌結構形變檢測.pdf
- 格與概念格上的拓撲結構.pdf
- 面向函數(shù)型數(shù)據(jù)分析的機器學習算法研究及應用.pdf
- 面向臉部信息處理的機器學習與應用技術研究.pdf
- 面向制鞋涂膠的SCARA機器人結構設計與研究.pdf
- 快速精確的結構化機器學習方法研究.pdf
- 面向蛋白質(zhì)功能位點識別的機器學習平臺構建.pdf
- 基于概念格的面向?qū)ο蟪绦蚧貧w測試.pdf
- 面向運動目標檢測與識別應用的機器學習算法及其并行優(yōu)化研究.pdf
- 基于高斯過程機器學習的結構可靠度分析方法研究.pdf
評論
0/150
提交評論