《计算机视觉应用开发》课件 cha6 5_VGG-19.pptx

下载文档

0
0
约1.1千字
约 11页
2023-07-22 发布于山东
举报
版权申诉
保障服务

《计算机视觉应用开发》课件 cha6 5_VGG-19.pptx

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

VGG-19 VGG-19的由来01任务结构解析02任务学习目标了解VGG-19的由来掌握VGG-19的网络结构 1VGG-19的由来 1VGG-19的由来2014年，牛津大学计算机视觉组（Visual Geometry Group）和Google DeepMind公司的研究员一起提出了一种新的深度卷积神经网络：VGGNet，并取得了ILSVRC2014比赛分类项目的第二名。VGGNet的主要贡献是使用很小的卷积核(3×3)构建各种深度的卷积神经网络结构，并对这些网络结构进行了评估，最终证明在16-19层的网络深度能够取得较好的识别精度。这也就是常用来提取图像特征的VGG-16和VGG-19。 2结构解析 2结构解析VGG-19整体由五个卷积块和3个全连接层组成，每个卷积块由不同层数的卷积层构成。其中第一，二个卷积块分别有两个卷积层，第三，四，五个卷积块分别有四个卷积层。那VGG-19中的19是怎么来的？这里的19只算了卷积层（16层）和全连接层（3层）的数量，没有包括池化层。VGG-19的输入为224×224×3的图像，并且对图像做了均值处理，在每个像素中减去在训练集上计算的RGB均值。 2结构解析VGG-19中使用的都是3×3的卷积核，来代替比较大的卷积核，并且使用了连续多个卷积层。使用小的卷积核的问题是，其感受野必然变小，但使用连续的卷积核，可以增大感受野。卷积的固定步长为1，并在图像的边缘填充1个像素，这样卷积后保持图像的分辨率不变；连续的卷积层（卷积块）后会接着一个池化层，做最大池化，步长为2；最后一层卷积层之后，接着的是3个全连接层，前两个每个都有4096个通道，第三是输出层输出1000个分类。 2结构解析 2结构解析VGG-19优势：VGG-19的结构很是简洁，整个网络都使用了一样大小的卷积核尺寸（3×3）和最大池化尺寸（2×2）。几个小滤波器（3×3）卷积层的组合比一个大滤波器（5×5或7×7）卷积层好，验证了经过不断加深网络结构能够提高性能。VGG-19缺点：VGG-19耗费更多计算资源，而且使用了更多的参数，致使更多的内存占用（140M）。其中绝大多数的参数都是来自于第一个全连接层。VGG-19但是有3个全连接层。注：不少pretrained的方法就是使用VGG的model（主要是16和19），VGG相对其余的方法，参数空间很大，最终的model有500多m，AlexNet只有200m，GoogLeNet更少，因此train一个VGG模型一般要花费更长的时间，所幸有公开的pretrained model让咱们很方便的使用。 ThankYOU!