固态硬盘与yolov1的比较

Yolo系列和ssd分别发布在yolov1、ssd、Yolo V2和Yolo V3。当然,现在yolov4也出现了。这是我看完yolov1后看ssd论文时记录的笔记,所以会涉及到很多和yolov1的对比。

快速rcnn系列的模型例程:

1.使用预设的边界框,

与fasterRCNN的区别在于没有使用RPN和池操作。

论文的贡献:

1.引入了单级检测器,比之前的算法YOLOv1更准确更快速,不使用RPN和池化操作;

2.将小卷积滤波器应用于不同的特征地图层,以预测BB类别的BB偏差;

3.在更小的输入图像中可以获得更好的检测效果(与FAST-RCNN相比);

4.在几个数据集(PASCAL、VOC、COCO、ILSVRC)上的测试结果表明,它可以获得较高的mAp值;

整个网络是一个基于前向反馈的卷积网络。SSD模型最终提供了一个固定大小的包围盒集合以及这些包围盒是否具有分类项目的分数的集合。通常,在模型之后添加非最大值抑制步骤,以提供最终的检测结果。

中枢网络

骨干网以VGG为基础,是一个高质量的分级网络。这个基本模型作为ssd的前端层,为后端层提供高质量的图像分类。我们称这一层为基本网络。请注意,使用此基本模型时,需要截断最后一个分类图层。这里使用的是VGG16网络。然后添加辅助结构以提供最终的检测功能。

骨干网对VGG16的改造:

1.将VGG16的FC6和FC7层转换为卷积层,如Conv6和Conv7所示;在1上;

2.移除所有漏失层和FC8层;

3.添加阿特鲁算法(空洞算法),参考此链接;

4.将Pool5从2x2-S2转换为3 x3-s 1;

最终检测功能的实现依赖于以下关键技术:

在基本网络之后,增加了许多卷积层,卷积层不断减小特征图的宽度和高度,例如,在一层卷积之后,从8×8减小到4×4。然后将目标检测算法应用于这些特征图。如上图所示,对于前一层,相当于在8 8的相对小的尺度上检测到每个位置四个固定纵横比的包围盒,而对于后一层,相当于在4 4的相对大的尺度上检测到每个位置四个固定纵横比的包围盒。这样就实现了在多尺度特征图上检测的目的。

图中所有通道对应位置的像素点集合被认为是一个锚点,因此每个锚点将有N个比率边界框。应当注意,每层中边界框的数量不一定相同。

我们从要素图层或要素地图中提取要素。要素图层可以是基本网络之上的图层,也可以是添加在基本网络之后的卷积图层。对于一个m x nxc的特征图层,使用一个3x3xp的小核,那么对于每个输出像素,可以得到一个通道数为P的检测结果,一般p=4 (|Classes|+4),最后可以得到大小为m n p的检测结果,这个检测结果包含了每个位置的分类项的置信度和四个(cx,cy,w,h)表示位置和偏差。因为边界框的数量设置为4,所以结果为4 (|Classes|+4)。

需要注意的是,这里使用的卷积预测器不是全连接层(yolov1使用全连接层)。

这里的边界框概念类似于更快的R-CNN中的锚框,但这里不同的要素地图图层可以排列不同形状和数量的边界框。这样可以有效地将可能的输出框的空间离散化(想象一下,如果每个特征图的包围盒长度几乎相同,可能的差异只是大小。我们需要不同大小和形状的盒子来配合真实物品的坐标,所以盒子越多越好。

训练SSD和训练使用区域建议的典型检测器之间的关键区别在于,地面实况信息需要被分配给检测器输出的固定集合中的特定输出。

真实的物体坐标框架称为地面真实。对于一张图,SSD模型每一层测试后都会有8732个先验框(即测试结果)。需要标注这些检测结果哪些是阳性样本,哪些是阴性样本。这些阅卷过程都是在训练前完成的;不同层中默认框的数量和大小也在训练期间确定。你还需要准备挖掘疑难负面案例的策略。

对于标记的真实帧GT,需要选择哪个预测帧对应于真实帧。这里的选择是jaccard overlap & gt0.5的所有默认框。以便阳性和阴性样本不会有很大的不同。在多框纸张中,只有具有最高jaccard重叠的框架将被选择。

以我个人的理解,这里的预测框是指没有偏移变化的先验框,也叫先验框。GT确定后,输入图像大小固定,先验框确定后,可以得到JAC card overlap >:0.5的所有先验框。然后在学习的时候,这些正例需要根据地面真相学习偏移量和长宽比缩放。而其他反面例子不需要学习位置参数。

是图像面积的交比。

在训练的过程中,首先要确定训练图片中的地面真实(真实目标)与哪个先验帧匹配,匹配的先验帧对应的边界框将负责预测。

在Yolov1中,哪个单元格是地面真值的中心,这个单元格中IOU最大的包围盒负责预测。但是在SSD中就完全不同了,SSD优先帧和地面真实主要有两个匹配原则。

首先,对于图片中的每一个地真相,找到IOU最大的前一帧,前一帧与之匹配,从而保证每一个地真相都必须匹配一个前一帧。通常情况下,与地面真值相匹配的先验盒称为正样本(实际上应该是与先验盒相对应的预测盒,但之所以这么叫是因为一一对应)。相反,如果一个先验框不匹配任何地面真值,那么这个先验框只能匹配背景,这是一个负样本。一个画面里的地面真实很少,但是有很多先验框架。如果只按照第一个原则匹配,很多先验帧会是负样本,正负样本极不平衡,所以需要第二个原则。

第二个原则是,对于剩余的未匹配的先前帧,如果基础真值的IOU大于某个阈值(通常为0.5),则先前帧也与基础真值匹配。这意味着某个地面实况可能匹配多个先验框,这是可以的。但反过来,它不能,因为一个先验框只能匹配一个地面真相。如果多个基本事实和先前框IOU大于阈值,则先前框将仅匹配具有最大IOU的先前框。第二个原则必须在第一个原则之后进行。仔细考虑这种情况。如果某个基础真值对应的最大IOU小于阈值,匹配的先验框大于另一个基础真值的IOU,那么先验框应该匹配谁?答案应该是前者。首先,确保某个基础事实必须有一个先验框与之匹配。

损失函数是回归损失和置信损失的加权平均值

下面是仓位回归损失函数的介绍,让你晕头转向。

n代表匹配盒,应该理解为正样本盒。首先,G代表地面真相框的每个索引,D代表先验框的每个索引,L代表预测结果的每个索引。g这是从g和d得到的一个指标,可以和预测结果进行匹配,计算损失函数。例如,索引g^cx是归一化的横坐标偏移索引,因为先前帧的中心不会完全与地面实况的中心重合,所以计算实际偏移。这个值就是我们希望模型学习的。类似地,先前框的宽度将不会与地面实况的宽度完全一致。我们用log函数计算G W,也就是说我们要学习的宽度也是这样变换的。

SmoothL1损失函数长这样:

分类的置信度损失函数如下:正样本的softmax损失函数和负样本的背景置信度损失。

在一些论文方法中,为了获得不同尺度的图片结果,对图片进行不同尺度的缩放,然后最后将每个缩放尺度的结果进行组合。本文采用的方法是使用从同一网络的不同层提取的特征图,以获得与上述缩放效果相同的结果。

我觉得这个想法真的很棒,超级棒。这样,不仅可以使用参数* * *,而且非常方便。研究表明,使用前一层的特征图可以优化语义分割质量,因为前一层可以获得关于输入的更详细和高质量的信息。

这张图上有两张特征图。我们知道网络的不同层次有不同的感受域。在SSD中,边界框的大小不需要匹配相应层的感受野。我们设计了包围盒的大小规则,使得每个特征图可以自己计算。

如果我们用m个特征图,其中1表示较低层,m表示较高层。边界框的默认尺寸根据以下计算公式计算

边界框的水平和垂直比例为

什么是硬负挖掘:

1对于目标检测,我们会提前标记地面真相,然后在算法中生成一系列的提议。这些建议中有些与标明的地面真相一致,有些则不一致。如果重合度(IOU)超过一定阈值(通常为0.5),则认为是正样本,以下为负样本。

然后扔进网络进行训练。反正可能会有一个问题,就是正样本的数量远远少于负样本的数量,所以训练出来的分类器效果总是有限的,会有很多误报。这些高分的假阳性被视为所谓的硬阴性。由于挖掘产生了这些硬阴性,将这些硬阴性抛入网络得到类别的损失函数,将这些难阴性样本的损失函数作为背景损失函数,从而加强分类器的误报分辨能力。

大部分包围盒最后都是无项匹配的,这样会导致负样本和正样本严重失衡。SSD在这里并不使用所有的负样本,而是将每个负样本的包围盒按照其置信度损失进行排序,然后选择最大的一批作为负样本,这样负样本与正样本的比例就稳定在3: 1。实践证明,这种方式使得优化分片更快,训练更稳定。

在数据的扩展策略中,数据来自以下三种类型之一。

基本网络是VGG16。SSD300的型号如上图结构图所示。新层在xavier模式下初始化(/p/22028079,/p/22044472)。实验表明,SSD在定位上优于RCNN,因为它直接学习并返回到神经网络模型中物体的形状。但是SSD容易出现分类错误,尤其是相似的类别(比如动物)。SSD对边界框的大小很敏感,即小对象的性能不如大对象。结合模型,因为小物体的预测用的是网络的前层,而前层没有太多的信息。虽然存在上述问题,但SSD在大对象上表现不错,2000对不同长宽比的对象都很鲁棒。

下图显示了ssd中的哪些技术提高了性能。

绩效改进的贡献:

SSD如何通过数据扩展提高小物体的探测精度

SSD使用VGG16(但取消了fc层加速),YOLO普通版有24个卷积层。

SSD的输入大小相对较小(300 300),而YOLO是448 448。即使网络结构差不多,计算量差距还是挺明显的,加速也很正常。

Ssd是卷积完成的,yolo全连接。如果用gpu,那肯定是ssd快。

在ssd中,首先每个真实物体选择一个负责它的包围盒。在没有训练手指之前,因为先前边界框的位置被确定,所以具有最大IOU的那个被选择作为正样本。为了平衡正负样本的比例,IOU大于0.5的先验包围盒全部被设置为正样本。这使得模型更加稳定。

SSD算法思想和结构详解:/链接?URL = DG 930 wgj 8 grwergrmgmxzzom 8 ekfvznpmh 9s 51 ffnu 7 yblkadkvzz 1h 44 rgeibso 8 hjqdai 12 xf 6 e5j 1 _ qxJuzgq & amp;wd = & ampeqid = 8d 70 DD 720001f 29100000045 DC 1379d

固态硬盘详情/部件号57440670