機(jī)器視覺(jué)-YoloV8小目標(biāo)檢測(cè)參考文章
本文內(nèi)容基本摘抄自公眾號(hào)文章: 小目標(biāo)檢測(cè)問(wèn)題分析和優(yōu)化思路
小目標(biāo)檢測(cè)面臨的挑戰(zhàn):
- 可用特征少
- 定位精度要求高
- 數(shù)據(jù)集中的小目標(biāo)數(shù)量占比少
- 小目標(biāo)標(biāo)注面積占比小
- 樣本不均勻問(wèn)題
- 小目標(biāo)聚集問(wèn)題
- 網(wǎng)絡(luò)結(jié)構(gòu)問(wèn)題
優(yōu)化思路1: 數(shù)據(jù)增強(qiáng)
數(shù)據(jù)增強(qiáng)是一個(gè)提升檢測(cè)性能簡(jiǎn)單有效方法, 我們可以使用數(shù)據(jù)增強(qiáng)方法擴(kuò)充數(shù)據(jù)集規(guī)模、豐富數(shù)據(jù)集的多樣性,人為提升小目標(biāo)在整個(gè)數(shù)據(jù)集中的占比,使得網(wǎng)絡(luò)能充分學(xué)習(xí)到小目標(biāo)的特征。
數(shù)據(jù)增強(qiáng)的方式:
- 復(fù)制粘貼增強(qiáng)(copy paste), 隨機(jī)將小目標(biāo)在圖像上多復(fù)制幾個(gè)(純摳圖), 或者將復(fù)制一塊包含多個(gè)小目標(biāo)的區(qū)域(帶有背景context的摳圖),粘貼時(shí)可以隨機(jī)做一些變換(縮放、翻折、旋轉(zhuǎn)等)
- 過(guò)采樣增強(qiáng)(Over sampling),同一個(gè)圖像文件多復(fù)制幾份。
- 縮放和拼接(stitching), 將多個(gè)圖像文件拼接成一個(gè)圖像文件, yolov8 的 Mosaic 技術(shù)就是將4張圖像進(jìn)行翻轉(zhuǎn)\縮放拼成1張圖像送到網(wǎng)絡(luò)中.
增加小目標(biāo)檢測(cè)層
- 使用YoloV8 P2模型
- 這篇文章增加小目標(biāo)檢測(cè)層, https://blog.csdn.net/m0_70388905/article/details/125392908 , 貌似只有兩行參數(shù)和YoloV8 P2模型不一致.
使用SAHI技術(shù)
https://learnopencv.com/slicing-aided-hyper-inference/
引入注意力機(jī)制
解決問(wèn)題: 目標(biāo)和背景相似, 目標(biāo)難以識(shí)別.
萬(wàn)字長(zhǎng)文解析cv中的注意力機(jī)制 https://mp.weixin.qq.com/s/kt3iIuOD3lsZBTIbOSGN0g
https://blog.csdn.net/m0_70388905/article/details/128103103
https://zhuanlan.zhihu.com/p/650309601
https://blog.csdn.net/qq_43471945/category_12467149.html
https://blog.csdn.net/qq_43471945/article/details/132685642
改進(jìn)特征融合方式
解決問(wèn)題: 目標(biāo)尺寸變化多樣問(wèn)題.
https://blog.csdn.net/m0_70388905/article/details/128103103
YOLOv8改進(jìn)-bifpn https://blog.csdn.net/weixin_45303602/article/details/132135514
YOLOv8主干網(wǎng)絡(luò)改進(jìn) 添加加權(quán)雙向金字塔結(jié)構(gòu)的特征加強(qiáng)模塊BiFPN https://zhuanlan.zhihu.com/p/674887344
購(gòu)買高手的咨詢
AI小怪獸 https://zhuanlan.zhihu.com/p/650309601
魔鬼面具 https://blog.csdn.net/qq_37706472
imagegeek https://blog.csdn.net/xss20072754?type=blog

浙公網(wǎng)安備 33010602011771號(hào)