機器視覺-幾篇小目標檢測論文的解讀
論文1
論文地址: https://www.mdpi.com/2227-9717/12/1/205
Research on an Intelligent Identification Method for Wind Turbine Blade Damage Based on CBAM-BiFPN-YOLOV8
Processes ( IF 3.5 ) Pub Date : 2024-01-18 , DOI: 10.3390/pr12010205
Hang Yu, Jianguo Wang, Yaxiong Han, Bin Fan, Chao Zhang
<<基于CBAM-BiFPN-YOLOV8的風電機組葉片損傷智能識別方法研究>>
為了解決風力渦輪機葉片損傷圖像檢測中復雜背景和多尺度特征分布的挑戰,我們提出了一種基于增強型YOLOV8模型的方法。我們的方法側重于三個關鍵方面:首先,我們通過將 CBAM 注意力機制集成到主干網絡中來增強小目標特征的提取。其次,使用加權雙向特征金字塔網絡(BiFPN)代替路徑聚合網絡(PANet)來改進特征融合過程。這種修改優先考慮深層特征中的小目標特征,并促進多尺度特征的融合。最后,我們將損失函數從 CIoU 改進為 EIoU,增強對小目標的敏感性和邊界框的抗擾動性,從而縮小計算預測與實際值之間的差距。實驗結果表明,與YOLOV8模型相比,CBAM-BiFPN-YOLOV8模型在準確率、召回率、mAP@0.5、mAP@0.5:.95方面分別提高了1.6%、1.0%、1.4%和1.1%。 , 分別。該增強模型全面實現了顯著的性能改進,以較低的計算成本證明了我們提出的增強功能的可行性和有效性。
更新日期:2024-01-20
解讀:
從文章看可以看出, 引入雙向特征金字塔網絡(BiFPN)和 CBAM 注意力機制, 能改善小目標檢測的效果, 按照下面文章講, CBAM是一個空間和通道相結合的注意力實現, BiFPN 可改善特征融合的效果,
萬字長文解析cv中的注意力機制: https://mp.weixin.qq.com/s/kt3iIuOD3lsZBTIbOSGN0g
論文2:
SF-YOLOv5: Improved YOLOv5 with swin transformer and fusion-concat method for multi-UAV detection
https://journals.sagepub.com/doi/10.1177/00202940231164126
代碼參考: https://blog.csdn.net/weixin_51692073/article/details/132724315
https://blog.csdn.net/weixin_45303602/article/details/133216041
文章提出使用 swin transformer + fusion-concat 進行無人機檢測, 效果看起來也很不錯. 但Transformer 需要更大的算力,

浙公網安備 33010602011771號