基于內容的視頻鏡頭檢測與分類研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年電子產業(yè)、多媒體技術和網絡技術的飛速發(fā)展,使得 Web中視頻資源——諸如視頻點播、數(shù)字電視、數(shù)字圖書館、視頻會議、遠程教育等等被越來越多的用戶使用。而視頻資源具有數(shù)據(jù)量龐大、復雜的多維結構和內容豐富多樣的特點,因此,面對這些海量的而且包含大量非結構化信息的視頻數(shù)據(jù)資源,如何快速地找到所需的視頻信息就成為一個急需解決的問題。視頻資源的管理和檢索技術的研究成為一個熱門的課題,各種各樣的視頻資源檢索系統(tǒng)也應需而生。本文通過對視頻內容的分析

2、,以視頻鏡頭為基本單位,實現(xiàn)了視頻資源的結構化管理,開發(fā)了一個基于鏡頭分類的視頻檢索系統(tǒng)。
  本文以實現(xiàn)視頻資源自動化管理為目的,遵循基于內容檢索的思路,對視頻的結構化處理、內容分析以及檢索技術進行了較為深入的研究。主要工作和創(chuàng)新點如下:
  1.通過觀察大量的視頻資源,從多個角度對常見的鏡頭語言和鏡頭運用技巧作了詳細的分析,按照本文制定的分類原則,依據(jù)不同的分類標準,提出了一種基于內容的視頻鏡頭分類體系,并分析各類鏡頭的

3、視覺特點。
  2.在總結現(xiàn)有視頻鏡頭檢測方法的特點的基礎上,本文提出了一種基于SVM的視頻鏡頭多分類檢測策略。通過提取多種有效的視頻內容特征參數(shù),利用SVM工具實現(xiàn)多種視頻鏡頭轉換方式的分類檢測,在實現(xiàn)鏡頭檢測的同時,實現(xiàn)了鏡頭在轉換方式方面的分類。
  3.在鏡頭分類方面,通過提取視頻鏡頭的動態(tài)特征——光流量分析,實現(xiàn)了視頻鏡頭運動方式的識別,并針對鏡頭運動方式的不同抽取相應數(shù)量的關鍵幀,做成視頻摘要,完成對視頻數(shù)據(jù)的索

4、引;通過提取視頻幀的靜態(tài)特征——顏色特征、邊緣特征等,實現(xiàn)了拍攝類鏡頭、創(chuàng)作類鏡頭、動畫類鏡頭、演示類鏡頭的自動分類識別。
  4.設計并實現(xiàn)了一個基于鏡頭分類的視頻檢索系統(tǒng),建立了視頻鏡頭資源索引庫,通過對視頻資源的自動分析,完成視頻資源的有效索引,取得了較好的實驗效果。
  本文的視頻鏡頭檢測實驗平臺、視頻鏡頭分析系統(tǒng)和基于鏡頭分類的視頻檢索系統(tǒng),基于Windows XP操作系統(tǒng),以Visual C++6.0為平臺,借助

5、DirectSDK軟件包開發(fā)實現(xiàn)。
  研究結果表明,對視頻資源進行分層次管理,不僅能夠實現(xiàn)資源快速有效地檢索,而且鏡頭作為視頻的基本物理單元,在視頻的語義分析中通常能夠提供有效的分析線索,是視頻的底層特征與高層語義特征之間建立聯(lián)系的紐帶。本文就是在鏡頭層面上建立起一個各領域通用的視頻資源檢索系統(tǒng),適用于各類攝像專業(yè)人士或愛好者對視頻資料中的特定類型的鏡頭進行查詢、瀏覽和管理,能夠迅速準確地向查詢者展現(xiàn)某一種特定鏡頭的特點。即可用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論