近日,在國際頂級賽事PASCAL VOC 2012 挑戰賽通用物體檢測 Competition 4 任務中,第四范式分別采用多模型融合與單模型兩種方案,兩天內兩次刷新該任務檢測成績,占據總排名前兩位。在該項目的20項細分物體檢測任務中,第四范式在其中12項取得最好成績。
第四范式本次采用的兩種競賽方案,其中排名第一位的方案引入多層次深度遷移學習技術的多模型融合方案提升了識別精準度、魯棒性;排名第二位的自適應候選框提取方法的單模型方案,具備高效、快速、更適合實際部署與應用等優勢。
第四范式基于不同方案占據該項目競賽前兩位
PASCAL VOC 挑戰賽以質量高、場景復雜、目標多樣、檢測難度大著稱,以快速檢驗算法有效性,吸引了國內外AI公司、高校、研究機構競相展開激烈競爭。目前,PASCAL VOC數據集囊括人、動物、交通工具、室內物體等20個類別。在PASCAL VOC 眾多賽事中,2012 挑戰賽因數據量最大、覆蓋真實場景多且復雜,成為衡量技術實力的標尺。
在圖片檢測中,由于圖片中的物體往往尺寸大小差異極大,參賽者往往采用多個尺度(一般4到6個)的測試策略(multi-scale test),即用放大版圖片檢測小物體,用縮小版圖片檢測大物體。雖然多尺度的檢測方式對于提升準確率非常有效,但該方式存在占用計算資源大、反饋延遲等缺陷,嚴重影響了實際的應用效果。
第四范式基于第四范式AutoCV的簡單、好用原則,設計了“自適應候選框提取方法”,可解決圖片中不同物體尺度差距大的問題,只需單個尺度的圖像輸入就能達到甚至超過多尺度的效果,節省資源的同時,可保證準實時的物體檢測。