OpenCV 機器視覺的四大任務
CV的四大任務
-
圖像分類(image classification), 檢查圖像中是否包含某種物體, 或者包含哪些物體.
-
目標檢測(Object detection 或 Object localization), 確定目標的位置和類別, 用bounding box圈出具體的位置
-
語義分割 (semantic segmentation) 對圖像進行像素級的分類, 預測每個像素屬于具體的分類, 但不區分不同的個體, 相連個體會被標記為同一顏色.
-
實體分割(instance segmentation) 比語義分割更進一步, 預測每個像素屬于哪個分類, 同時區分不同的個體.

算法
- 圖像相關神經網絡算法的發展歷史:Lenet -> Alexnet -> ZFnet -> VGG -> NIN -> googleNet -> ResNet -> DenseNet -> Resnext -> EfficientNet
- 目標檢測算法包括: 基于區域的方法、單階段檢測、雙階段檢測。其中單階段最有名為 Yolo 系列. 雙階段包括 R-CNN, Fast R-CNN Faster R-CNN, Mask R-CNN, SPP-net , 雙階段是將物體識別和定位分到兩個步驟完成, 特點是:錯誤率低, 但因為網絡結構參數多, 計算量大導致檢測速度慢, 不能滿足實時場景. 單階段是一個階段即標識出物體類別和坐標, 識別速度快, Yolo系列準確率也已經基本達到faster R-CNN的水平.
參考:
https://cloud.tencent.com/developer/article/2322720
https://blog.csdn.net/weixin_44097477/article/details/123525344

浙公網安備 33010602011771號