編號:SBJS00988
篇名:細(xì)粒度圖像分類綜述
作者:申志軍 穆麗娜 高靜 史遠(yuǎn)航 劉志強(qiáng)
關(guān)鍵詞: 細(xì)粒度圖像分類 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) 注意力機(jī)制 計(jì)算機(jī)視覺
機(jī)構(gòu): 阜陽師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院 內(nèi)蒙古農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院
摘要: 細(xì)粒度圖像具有類內(nèi)方差大、類間方差小的特點(diǎn),致使細(xì)粒度圖像分類(FGIC)的難度遠(yuǎn)高于傳統(tǒng)的圖像分類任務(wù)。介紹了FGIC的應(yīng)用場景、任務(wù)難點(diǎn)、算法發(fā)展歷程和相關(guān)的常用數(shù)據(jù)集,主要概述相關(guān)算法:基于局部檢測的分類方法通常采用連接、求和及池化等操作,模型訓(xùn)練較為復(fù)雜,在實(shí)際應(yīng)用中存在較多局限;基于線性特征的分類方法模仿人類視覺的兩個(gè)神經(jīng)通路分別進(jìn)行識別和定位,分類效果相對較優(yōu);基于注意力機(jī)制的分類方法模擬人類觀察外界事物的機(jī)制,先掃描全景,后鎖定重點(diǎn)關(guān)注區(qū)域并形成注意力焦點(diǎn),分類效果有進(jìn)一步的提高。最后針對目前研究的不足,展望FGIC下一步的研究方向。