半監(jiān)督聚類集成方法及其應用研究.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著信息技術和網(wǎng)絡技術的迅猛發(fā)展,人們獲取信息的能力和渠道得到極大的擴展。海量數(shù)據(jù)在豐富人們資訊的同時,也給信息的組織、查找和分析帶來極大的挑戰(zhàn)。如何快速、準確地從海量知識庫中提取有用的信息,成為很有價值的研究課題。
  一方面,本文研究的聚類是數(shù)據(jù)分析的一個重要研究內容:尋找并利用輸入數(shù)據(jù)集中潛藏的結構或者規(guī)律,按照最大化簇內相似性、最小化簇間相似性的原則,實現(xiàn)訓練樣本劃分聚簇的預測。雖然數(shù)據(jù)收集方法的多樣化和存儲技術的快速發(fā)展

2、使得收集數(shù)據(jù)變得相當容易,但這些數(shù)據(jù)大多沒有類別標記,而在實際的某些應用中人們可以獲得少量的標簽信息,加上大數(shù)據(jù)時代下的數(shù)據(jù)對象抽象復雜,應現(xiàn)實需要和時代要求,至今已提出大量改進的創(chuàng)新理論和方法,其中以半監(jiān)督聚類和聚類集成為代表的研究取得了豐碩的成果。半監(jiān)督聚類集成是論文研究的重點。另一方面,圖像是多媒體時代重要的產(chǎn)物?;趦热莸膱D像檢索能有效存儲和管理海量的圖像資源,然而它受到“語義鴻溝”制約,建立語義映射的圖像標注成為多媒體領域研究

3、的重要課題?,F(xiàn)有圖像標注效果在較大程度上依靠于圖像分割和聚類技術,而分割方法難以突破、無監(jiān)督聚類效果不佳,論文嘗試從半監(jiān)督聚類角度挖掘圖像語義內容,對基于聚類的圖像標注展開研究。
  論文首先分析聚類與半監(jiān)督聚類的研究背景和現(xiàn)狀;接著探討半監(jiān)督聚類集成關鍵技術;然后重點闡述提出的約束與度量相結合的半監(jiān)督聚類集成方法及其在圖像自動標注中的應用,詳細解釋方法的理論基礎和建模過程,結合實驗結果進行對比分析;最后對論文研究工作進行總結以及

4、對進一步研究進行探討和展望。論文取得的成果主要有:
  現(xiàn)有的半監(jiān)督聚類算法主要有兩類,基于約束的方法和基于度量的方法。這兩類算法有自己的側重點,但它們并不是完全分離開的,或者說它們也存在共生關系,因為在實際算法中,兩個因素都考慮的話可以得到更令人滿意的結果。目前的基于約束和度量的融合方法大部分是在同一個目標函數(shù)中實現(xiàn)兩者優(yōu)勢互補,極少運用集成機制將兩者整合到一致性函數(shù)中。本文提出約束和度量相結合的半監(jiān)督聚類集成方法,分別采用基于

5、約束的方法和基于度量的方法得到多個基聚類,最后運用集成策略將其整合求取最終結果。
  關于圖像數(shù)據(jù)的度量,先前的方法大都只考慮像素固有特征。然而像素與它的鄰域像素是緊密關聯(lián)的,故在目標函數(shù)中考慮鄰域空間信息是有必要也更合理的,目前通常采取的方法是計算均值、加權均值或統(tǒng)計算子等,但是這樣得出的結果與實際特征之間仍然會存在或大或小的差距,為了縮小這樣的差距,文中考慮一種新的方法,像素之間的距離由它們的固有特征和鄰域空間信息共同決定,這

6、一方法打破了傳統(tǒng)的單一視角,更加準確地反映出像素之間的度量關系。準確的度量測度有助于聚類性能的提高。
  圖像的內容往往具有復雜性、模糊性、抽象性和多義性等特點,如果只是僅僅依靠低層視覺特征對圖像進行描述的說服力遠遠不夠,這就需要將低層特征映射到高級語義,得到能夠反映圖像內容的語義概念。文中采用關鍵詞分類法自動獲得輔助半監(jiān)督聚類的區(qū)域標注(監(jiān)督信息),進而將提出的約束與度量相結合的半監(jiān)督聚類集成方法與跨媒體相關模型結合,采用重采樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論