VMware的DevOps转型之旅

发布时间：2021-02-12 14:02:15 所属栏目：传媒来源：互联网

导读：不过，R-CNN也有一些问题：该方法仍然需要分类所有地区建议，可能导致达到计算瓶颈不可能将其用于实时用例。在选择性搜索阶段不会学习,可能导致针对某些类型的数据集会提出糟糕的区域建议。 3. 小小的改进：Fast R-CNN(快速R-CNN) Fast R-CNN，顾名思义，

不过，R-CNN也有一些问题：

该方法仍然需要分类所有地区建议，可能导致达到计算瓶颈——不可能将其用于实时用例。
在选择性搜索阶段不会学习,可能导致针对某些类型的数据集会提出糟糕的区域建议。

3. 小小的改进：Fast R-CNN(快速R-CNN)

Fast R-CNN，顾名思义，比R-CNN快。它基于R-CNN，但有两点不同：

不再向CNN提供对每个地区的提议,通过对CNN提供整幅图像来生成一个卷积特性映射(使用一个过滤器将矢量的像素转换成另一个矢量,能得到一个卷积特性映射)。接下来，建议区域被识别与选择性搜索，然后利用区域兴趣池(RoI pooling)层将它们重塑成固定大小，从而能够作为全连接层的输入。
Fast-RCNN使用更快,精度更高的softmax层而不是SVM来进行区域建议分类。

以下是该网络的架构：

综上所述，R-CNN遵循以下步骤：

根据选择性搜索创建区域建议(即,对图像中可能包含对象的部分进行预测)。
将这些地区带入到pre-trained模型，然后运用支持向量机分类子图像。通过预先训练的模型运行这些区域，然后通过SVM(支持向量机)对子图像进行分类。
通过边界框预测来运行正向预测，从而获得更好的边界框精度。
在预测过程中使用NMS去除重叠的建议。

到R-CNN方法，如果IoU低于给定的阈值(0.3)，那么相对应的标签将是0。

在对所有区域建议运行分类器后，R-CNN提出使用一个特定类的边界框(bbox)回归量来优化边界框。bbox回归量可以微调边界框的边界位置。例如，如果选择性搜索已经检测到一只狗，但只选择了它的一半，而意识到狗有四条腿的bbox回归量，将确保狗的整个身体被选中。

也多亏了新的bbox回归预测，我们可以使用非最大抑制(NMS)舍弃重叠建议。这里的想法是识别并删除相同对象的重叠框。NMS根据分类分数对每个类的建议进行排序，并计算具有最高概率分数的预测框与所有其他预测框(于同一类)的IoU。如果IoU高于给定的阈值(例如0.5)，它就会放弃这些建议。然后对下一个最佳概率重复这一步。

在了解了选择性搜索的工作原理后，接着看一些使用该法最常见的目标检测算法。

2. 第一目标检测算法：R-CNN

Ross Girshick等人提出了区域CNN(R-CNN)，允许选择性搜索与CNN结合使用。实际上，对于每个区域方案(如本文中的2000)，一个正向传播会通过CNN生成一个输出向量。这个向量将被输入到one-vs-all分类器中。每个类别一个分类器，例如一个分类器设置为如果图像是狗，则标签=1，否则为0，另一个分类器设置为如果图像是猫，标签= 1，否则为0，以此类推。R-CNN使用的分类算法是SVM。

但如何将该地区标记为提议呢?当然，如果该区域完全匹配真值，可以将其标为1，如果给定的对象根本不存在，这个对象可以被标为0。

如果图像中存在对象的一部分怎么办?应该把这个区域标记为0还是1?为了确保训练分类器的区域是在预测一幅图像时可以实际获得的区域(不仅仅是那些完美匹配的区域)，来看看选择性搜索和真值预测的框的并集(IoU)。

IoU是一个度量，用预测的框和真值框的重叠面积除以它们的并集面积来表示。它奖励成功的像素检测，惩罚误报，以防止算法选择整个图像。

（编辑：阳江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!