深度学习网络

SVM Support Vector Machine 支持向量机

https://blog.csdn.net/v_july_v/article/details/7624837

https://www.jianshu.com/p/96e8fad1a2a4

线性分类器:找超平面分开。logistic函数(sigmoid函数)将自变量映射到(0,1)上,回归就是学习参数矩阵,找到后直接判断结果是正还是负即可。

几何间隔:点到分类面的距离。

支持向量的距离最近,为1/||w||

非线性可分则选择核函数将数据映射到高维空间解决问题。

避免过拟合可以使用别的损失函数,加上正则化项

CNN

http://www.cnblogs.com/lc1217/p/7324935.html

RCNN

https://www.cnblogs.com/skyfsm/p/6806246.html // 挺生动形象的

https://blog.csdn.net/lhanchao/article/details/72287377

候选区域选择、CNN特征提取、分类与边界回归

检测时每一类都使用一个SVM(用于判断是否是这类)

RCNN里面用到的Selective Search算法见:

https://blog.csdn.net/small_munich/article/details/79595257

对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形),

SPP-NET

在RCNN中,提取特征耗时较长,因此在初始没有提取特征的时候就先进行卷积运算,减少卷积运算数目,以加速。

同时取消掉了图像归一化的过程,同时使用空间金字塔池化。

空间金字塔池化:一种可伸缩的池化层,输出都是特定尺寸的特征。金字塔可以通过多尺度增加特征鲁棒性。

Fast-RCNN

简化版的池化层(无金字塔),加入了候选框映射功能以反向传播。多任务Loss层(SoftmaxLoss代替SVM,SmoothL1Loss取代Bounding box回归),将分类与边框回归进行合并。多连接层通过SVD加速

Faster-RCNN

使用EdgeBoxes(https://blog.csdn.net/wsj998689aa/article/details/39476551)提取候选框,并且是在特征图上提取。

YOLO

划分为固定网络,如果样本中心落在对应网络,就负责回归。