近日,在國(guó)際頂級(jí)賽事PASCAL VOC 2012 挑戰(zhàn)賽通用物體檢測(cè) Competition 4 任務(wù)中,第四范式分別采用多模型融合與單模型兩種方案,兩天內(nèi)兩次刷新該任務(wù)檢測(cè)成績(jī),占據(jù)總排名前兩位。在該項(xiàng)目的20項(xiàng)細(xì)分物體檢測(cè)任務(wù)中,第四范式在其中12項(xiàng)取得最好成績(jī)。
第四范式本次采用的兩種競(jìng)賽方案,其中排名第一位的方案引入多層次深度遷移學(xué)習(xí)技術(shù)的多模型融合方案提升了識(shí)別精準(zhǔn)度、魯棒性;排名第二位的自適應(yīng)候選框提取方法的單模型方案,具備高效、快速、更適合實(shí)際部署與應(yīng)用等優(yōu)勢(shì)。
第四范式基于不同方案占據(jù)該項(xiàng)目競(jìng)賽前兩位
PASCAL VOC 挑戰(zhàn)賽以質(zhì)量高、場(chǎng)景復(fù)雜、目標(biāo)多樣、檢測(cè)難度大著稱,以快速檢驗(yàn)算法有效性,吸引了國(guó)內(nèi)外AI公司、高校、研究機(jī)構(gòu)競(jìng)相展開激烈競(jìng)爭(zhēng)。目前,PASCAL VOC數(shù)據(jù)集囊括人、動(dòng)物、交通工具、室內(nèi)物體等20個(gè)類別。在PASCAL VOC 眾多賽事中,2012 挑戰(zhàn)賽因數(shù)據(jù)量最大、覆蓋真實(shí)場(chǎng)景多且復(fù)雜,成為衡量技術(shù)實(shí)力的標(biāo)尺。
在圖片檢測(cè)中,由于圖片中的物體往往尺寸大小差異極大,參賽者往往采用多個(gè)尺度(一般4到6個(gè))的測(cè)試策略(multi-scale test),即用放大版圖片檢測(cè)小物體,用縮小版圖片檢測(cè)大物體。雖然多尺度的檢測(cè)方式對(duì)于提升準(zhǔn)確率非常有效,但該方式存在占用計(jì)算資源大、反饋延遲等缺陷,嚴(yán)重影響了實(shí)際的應(yīng)用效果。
第四范式基于第四范式AutoCV的簡(jiǎn)單、好用原則,設(shè)計(jì)了“自適應(yīng)候選框提取方法”,可解決圖片中不同物體尺度差距大的問題,只需單個(gè)尺度的圖像輸入就能達(dá)到甚至超過多尺度的效果,節(jié)省資源的同時(shí),可保證準(zhǔn)實(shí)時(shí)的物體檢測(cè)。