面向圖像分類的主動學習算法研究.pdf_第1頁
已閱讀1頁,還剩111頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、圖像分類是計算機視覺、模式識別領域的研究熱點,在智能交通、安全監(jiān)控、機器人導航等領域有著廣泛的應用。在圖像分類中,需要大量有標記的樣本來訓練穩(wěn)定的分類模型,以實現(xiàn)對未知圖像的準確分類。但是在實際應用中,有標記的圖像數量非常之少,無標記的圖像卻隨處可見,且圖像的人工標記是件費時費力的工作。為了減少人工標記工作量,主動學習(Active Learning)技術被引入到圖像分類中。
  主動學習的主要思想是:在大量未標記的樣本中,采用某

2、種策略,挑選少量最有信息量且最具代表性的樣本交給專家進行標記。使用標記過的樣本訓練模型,實現(xiàn)對未知樣本的準確分類。主動學習的核心技術是如何設計準則來挑選最具信息量的樣本,以最大程度提升分類模型的性能。
  本文研究面向圖像分類的主動學習技術,提出了幾種新的主動學習方法,通過圖像分類實驗驗證了它們的有效性。
  本文的主要工作和創(chuàng)新點集中在以下幾個方面:
  首先,在最優(yōu)實驗設計(OED)算法的基礎上,考慮樣本之間的近鄰

3、重構關系,提出一種近鄰保持的實驗設計方法(NPDOD)。傳統(tǒng)的OED只考慮標記樣本的平方誤差,而忽視了未標記樣本的信息。受到局部線性重構(LLE)的啟發(fā),本文假設樣本的類別標簽也可以由其近鄰樣本的標簽近似重構。NPDOD方法在最小化回歸平方誤差的同時,也最小化近鄰樣本的類別重構誤差,使得回歸模型方差最小的樣本被認為是最有信息量的樣本,被挑選標記且用于訓練模型。
  其次,提出基于動態(tài)規(guī)劃的多準則組合主動學習方法。傳統(tǒng)的主動學習方法

4、僅僅依賴于一個準則抽樣,如樣本的不確定性、密度等,但是忽視了樣本間的冗余性等信息。針對沒有初始標記樣本的情況,提出最大密度最小冗余的主動學習方法(MDMR),該方法可以挑選密度大且冗余性小的樣本進行標記;對于有少量初始標記樣本的情況,提出一種不確定性與多樣性組合的主動學習方法(AL_UD),挑選不確定性大、冗余性小的樣本標記。這兩種方法都將兩個準則有效的結合在一起,將樣本選擇問題,近似的轉變成一個動態(tài)規(guī)劃問題。
  此外,提出基于

5、二次規(guī)劃和子模塊函數的多準則主動學習方法。該方法在挑選樣本時,綜合考慮了樣本的不確定度、密度和冗余信息,提出了一種新的抽樣模型。該模型可以通過二次規(guī)劃方法和子模塊函數方法近似的求解。在二次規(guī)劃方法中,采用增廣拉格朗日乘子法以更快得求得最優(yōu)解;在子模塊函數方法中,使用了一種貪婪算法,子模塊函數的性質保證了最終解與全局最優(yōu)解的逼近程度。
  最后,提出基于半監(jiān)督學習的主動學習方法。主動學習方法只能利用標記的樣本而忽視了未標記樣本。半監(jiān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論