Monday, July 16, 2018

深入淺出 Deep Learning(六):R-CNN

深入淺出 Deep Learning(六):R-CNN

2018/02/03

前言:

R-CNN 是 Object Detection 從非 Deep Learning 方法跨到 Deep Learning 第一個成功的嘗試,R-CNN 後續演進為 Fast R-CNN,然後到 Faster R-CNN 終於進化到純 Deep Learning 的方法。下文將會仔細說明這個演進的過程。

-----

Summary:



-----



-----

Outline

一、SVM
二、SMO
三、DPM
四、SS
五、R-CNN
六、SPPNet
七、Fast R-CNN
八、Faster R-CNN

-----

一、SVM

-----




-----


Fig. 1. Support Vector Machine [3].

-----

二、SMO

SMO is a better SVM


三、DPM

DPM1 = Fixed Window + HOG + SVM

DPM2 = Sliding Window + HOG + SVM



Fig. 3.3. An overview of the feature extraction and object detection chain, p. 2 [6].


Fig. 3.2. The HOG detectors cue mainly on silhouette contours, p. 7 [6].




Fig. 7.1. The matching process at one scale, p. 1633 [1].

-----

四、SS

SS = SS + SIFT + SVM






-----

五、R-CNN

R-CNN = SS + CNN + SVM
多次提取、有 crop/warp





-----

六、SPPNet

SPPNet = SS + CNN (SPP) + SVM
一次提取、無 crop/warp










-----

七、Fast R-CNN

Fast R-CNN = SS + CNN + CNN
一次提取、無 crop/warp、SVM 改用 CNN
ROI pooling,類似 SPP,但只有一種 7x7 網格










-----

References

一、SVM

二、SMO

三、DPM

AI從頭學(三三):DPM
http://hemingwang.blogspot.tw/2017/07/aiobject-detection-with.html

四、SS

论文笔记:Selective Search for Object Recognition _ Jermmy's Lazy Blog
http://jermmy.xyz/2017/05/04/2017-5-4-paper-notes-selective-search/

五、R-CNN

六、SPPNet

SPPNet-引入空间金字塔池化改进RCNN
https://zhuanlan.zhihu.com/p/24774302

目标检测(3)-SPPNet
https://zhuanlan.zhihu.com/p/27485018

RCNN学习笔记(3) Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-net) - CSDN博客
http://blog.csdn.net/u011534057/article/details/51219959

Detection梳理:R-CNN-)SPPNet_Fast R-CNN-)Faster R-CNN-)SSD_FPN
https://zhuanlan.zhihu.com/p/33643708

七、Fast R-CNN

八、Faster R-CNN

No comments: