矩陣分解方法在圖像分類中的應用研究.pdf_第1頁
已閱讀1頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、圖像分類作為計算視覺和圖像處理領域中最重要和最具有挑戰(zhàn)的任務之一,已經受到越來越多研究者的關注。此處的圖像分類既包括自然圖像分類也包括人臉識別,如何有效地提高圖像分類精度,并減少計算開銷是亟待解決的問題?;谂袆e模型的自然圖像分類主要側重對下面幾個方面進行改進,即:特征提取、字典學習、特征編碼和空間融合等?;诮稻S的人臉識別技術是為了尋找一個映射將高維的人臉數據變換到低維空間中,并利用數據潛在的幾何結構信息。
  本論文研究基于矩

2、陣分解的圖像分類。從特征編碼和數據降維兩個方面分別提出了針對自然圖像分類和人臉識別的算法。同時,提出一種用于恢復聯合稀疏向量的快速求解算法。本文的主要創(chuàng)新點如下:
  1.在基于判別模型的自然圖像分類中,為了獲得最好的分類率,同時構造最優(yōu)的字典學習方法和特征編碼策略被認為是必要的。然而,最近的研究表明在自然圖像分類中,特征編碼比字典學習更重要。當使用稀疏算法進行特征編碼時,即使使用隨機生成的字典也能獲得滿意的分類結果?;谶@一發(fā)現

3、,本文提出了一種基于最近鄰基向量的自然圖像分類框架。在字典學習階段分別使用兩種方式,即:通過K均值聚類算法生成字典和通過對圖像的SIFT矩陣進行隨機采樣生成隨機字典,接下來,使用本文提出的軟內積編碼方法對特征進行編碼。在特征編碼之后,圖像的每個描述子可以由它最近鄰的幾個基向量進行線性表示。結合空間金字塔匹配模型和最大化空間融合(Pooling)函數得到每幅自然圖像的最終表示。在15 Scenes和UIUC Sports Event數據集

4、上獲得的分類率和計算速度都好于一些經典算法。
  2.用來做人臉識別的傳統(tǒng)非負矩陣分解模型沒有將數據的幾何結構信息和標簽信息同時考慮進去。本文借鑒流形學習中的技術構造圖拉普拉斯矩陣用來描述訓練樣本之間的關系,同時根據樣本的標簽信息建立一個類指示矩陣。接下來,將圖拉普拉斯矩陣和類指示矩陣分別作為正則項引入到目標函數中,提出了一種圖正則判別的非負矩陣分解算法。本文給出了優(yōu)化框架對應的乘性更新算法,并證明了它的收斂性。使用本文算法學習出

5、的投影矩陣對人臉圖像降維,在四個標準人臉數據集上的識別結果表明了本文所提算法的有效性。
  3.借鑒自然圖像分類中的空間金字塔匹配模型,并結合SIFT特征的非負性,本文提出了一種基于空間金字塔匹配的稀疏非負矩陣分解算法。給出了稀疏非負矩陣分解的乘性更新迭代規(guī)則和它的收斂性證明,使用該迭代規(guī)則學習字典并對特征編碼。根據對特征進行編碼之后獲得的系數矩陣,結合三層空間金字塔匹配模型和最大化融合函數得到圖像的最終表示。在幾個標準的人臉數據

6、集上的分類效果比傳統(tǒng)的PCA,LDA,LPP和NMF都要好一些。
  4.標準壓縮感知的目的是從單一觀測向量中恢復出稀疏信號,被稱為SMV模型。與其相反,從多元觀測向量中恢復出稀疏信號被稱為MMV模型。在本文中,我們考慮在MMV模型中恢復出聯合的稀疏信號,其中,用矩陣表示多元觀測向量,信號的聯合稀疏性是指矩陣中的很多行同時為零??梢詫⑾∈璧腗MV模型寫成矩陣的(2,1)-范數最小化問題,解該問題比傳統(tǒng)壓縮感知中的L1范數最小化要困

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論