

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、物體檢測(cè),即給定一張圖像,識(shí)別出其中的目標(biāo)物體并對(duì)其定位,是計(jì)算機(jī)視覺領(lǐng)域研究的一個(gè)重要和基礎(chǔ)問題。最近幾年隨著深度學(xué)習(xí)的快速發(fā)展,基于深度學(xué)習(xí)的物體檢測(cè)技術(shù)越來越受到重視。無人駕駛汽車、個(gè)人智能助手、智能安防等領(lǐng)域都依賴準(zhǔn)確高效的物體檢測(cè)算法。深度學(xué)習(xí)最大的優(yōu)勢(shì)就是端到端的訓(xùn)練和部署,使用通用的模型和大量標(biāo)注數(shù)據(jù)就能得到非常好的效果。圍繞基于深度學(xué)習(xí)的物體檢測(cè),本文分別從數(shù)據(jù)獲取和模型優(yōu)化兩個(gè)核心問題進(jìn)行了研究,并再此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)
2、物體檢測(cè)系統(tǒng)。本文主要分為以下三個(gè)部分:
一、自然場(chǎng)景中的平面圖案檢測(cè)具有非常廣泛的應(yīng)用需求,深度學(xué)習(xí)在這類應(yīng)用中被證明具有較好的檢測(cè)效果,但在真實(shí)場(chǎng)景中很難收集到大量可用于訓(xùn)練深度模型的圖像。為了應(yīng)對(duì)大量訓(xùn)練樣本獲取的困難,本文構(gòu)建了一個(gè)快速自動(dòng)生成大量訓(xùn)練樣本的方法。該方法通過對(duì)少量的模板樣本圖片應(yīng)用幾何和紋理變換,模擬多種自然場(chǎng)景中的效果,合成用于檢測(cè)的訓(xùn)練樣本。實(shí)驗(yàn)結(jié)果表明,使用本文方法合成的訓(xùn)練樣本可以取得與使用人工
3、標(biāo)注的真實(shí)樣本相近的效果。該方法減少了對(duì)人工標(biāo)注數(shù)據(jù)的依賴,降低了數(shù)據(jù)獲取成本。
二、Faster RCNN是物體檢測(cè)中被廣泛應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)模型。本文針對(duì)Faster RCNN方法對(duì)小尺寸物體檢測(cè)效果不好的情況,使用多尺度的卷積特征進(jìn)行物體的邊框提取和分類,并通過拼接多個(gè)層級(jí)的特征圖,使得網(wǎng)絡(luò)在抽取高層語義信息的同時(shí)不會(huì)丟失細(xì)節(jié)的圖像信息,實(shí)現(xiàn)在多尺度范圍上更準(zhǔn)確的檢測(cè)。通過Pascal VOC數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,對(duì)比
4、使用單層特征圖的網(wǎng)絡(luò),本文使用的網(wǎng)絡(luò)對(duì)小目標(biāo)物體的檢測(cè)有著更好的檢測(cè)效果。
三、鑒于使用深度學(xué)習(xí)方法進(jìn)行物體檢測(cè)具有相對(duì)統(tǒng)一的流程,可以通過模塊化的方法組合實(shí)現(xiàn),本文實(shí)現(xiàn)了一個(gè)可視化的物體檢測(cè)訓(xùn)練和識(shí)別系統(tǒng)。該系統(tǒng)使用B/S架構(gòu),采用模塊化設(shè)計(jì),支持多種數(shù)據(jù)集和物體檢測(cè)網(wǎng)絡(luò),覆蓋了數(shù)據(jù)輸入、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、模型評(píng)價(jià)等整個(gè)物體檢測(cè)流程。使用該系統(tǒng),不具有深度學(xué)習(xí)專業(yè)知識(shí)的用戶,通過web端網(wǎng)頁操作,就可根據(jù)自己的需要完成物體檢測(cè)深
最新文檔
- 自然場(chǎng)景中的文字檢測(cè)與識(shí)別技術(shù)研究.pdf
- 基于物體檢測(cè)的場(chǎng)景分類方法研究.pdf
- 自然場(chǎng)景下的文本檢測(cè)技術(shù)研究.pdf
- 機(jī)器人視覺系統(tǒng)中的物體檢測(cè)技術(shù)研究.pdf
- 視頻監(jiān)控場(chǎng)景中的運(yùn)動(dòng)物體檢測(cè)和跟蹤.pdf
- 視頻場(chǎng)景檢測(cè)的相關(guān)技術(shù)研究.pdf
- 復(fù)雜自然場(chǎng)景圖像中的文本檢測(cè)與識(shí)別技術(shù)研究.pdf
- 自然場(chǎng)景識(shí)別技術(shù)研究.pdf
- 自然場(chǎng)景中的文本檢測(cè)研究.pdf
- 復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的物體檢測(cè)與識(shí)別算法研究.pdf
- 復(fù)雜場(chǎng)景下運(yùn)動(dòng)物體檢測(cè)與跟蹤算法的研究.pdf
- 人臉識(shí)別中的活體檢測(cè)技術(shù)研究.pdf
- 大規(guī)模自然場(chǎng)景繪制技術(shù)研究.pdf
- 自然場(chǎng)景圖像中的文字檢測(cè).pdf
- 自然場(chǎng)景中漢字識(shí)別關(guān)鍵技術(shù)研究.pdf
- 自然場(chǎng)景下行人的視頻跟蹤技術(shù)研究.pdf
- 演示學(xué)習(xí)中物體檢測(cè)與跟蹤算法研究.pdf
- 自適應(yīng)多窗口的實(shí)時(shí)物體檢測(cè)技術(shù)的研究.pdf
- 自然場(chǎng)景中路牌漢字識(shí)別技術(shù)研究.pdf
- 自然場(chǎng)景圖像分割關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論