編號:CYYJ01672
篇名:基于ECA-Net與多尺度結合的細粒度圖像分類方法
作者:毛志榮 都云程 肖詩斌 施水才
關鍵詞: 注意力機制 深度學習 細粒度圖像分類
機構: 北京信息科技大學計算機學院 拓爾思信息技術股份有限公司
摘要: 針對細粒度圖像分類問題提出了一種有效的算法以實現(xiàn)端到端的細粒度圖像分類。ECA-Net中ECA(efficient channel attention)模塊是一種性能優(yōu)勢顯著的通道注意力機制,將其與經典網絡ResNet-50進行融合構成新的基礎卷積神經網絡ResEca;通過物體級圖像定位模塊與部件級圖像生成模塊生成物體級圖像和部件級圖像,并結合原始圖像作為網絡的輸入,構建以ResEca為基礎的三支路網絡模型Tb-ResEca-Net(three branch of ResEca network)。該算法在公有數據集CUB-200-2011、FGVC-aircraft和Stanford cars datasets上進行測試訓練,分別取得了89.9%、95.1%和95.3%的準確率。實驗結果表明,該算法相較于其他傳統(tǒng)的細粒度分類算法具有較高的分類準確率以及較強的魯棒性,是一種有效的細粒度圖像分類方法。