摘要:針對遙感圖像中背景復雜度高、目標尺寸多樣所導致的目標檢測精度低的問(wèn)題,提出一種基于改進(jìn) YOLOv5的遙感圖像目標檢測算法。該算法將具有Transformer風(fēng)格的ConvNeXt網(wǎng)絡(luò )作為主干網(wǎng)絡(luò ),以克服卷積神經(jīng)網(wǎng)絡(luò )(CNN)結構的局限性,捕獲更多全局信息。引入 SimAM 注意力機制在不增加網(wǎng)絡(luò )參數的情況下,推斷出特征圖的3D注意力權值,提高網(wǎng)絡(luò )的穩定性以及抗干擾能力。同時(shí)采用全局顯式集中調節方案的集中特征金字塔(CFP),捕獲全局長(cháng)距離依賴(lài)關(guān)系以及遙感圖像的局部關(guān)鍵區域信息。將本文提出的算法在 RSOD 數據集上進(jìn)行消融實(shí)驗,結果表明,本文提出的算法能夠顯著(zhù)提高遙感圖像目標檢測的平均準確率。