
VGGNet是由牛津大学视觉几何组Visual Geometry Group于2014年提出的经典卷积神经网络模型。相较于此前占据主导地位的AlexNetVGGNet通过统一使用小尺寸卷积核与模块化的堆叠思想显著加深了网络结构参数总计约1.38亿一、 模型整体架构VGGNet共包含六种不同的网络架构A至E分别对应不同的深度。所有模型均由六个大的特征块Block组成块与块之间通过最大池化层MaxPooling进行空间维度的下采样。VGGNet摒弃了AlexNet中使用的11x11和5x5大卷积核全面采用3x3的卷积核。大幅减少了网络参数并在每层之间插入了额外的ReLU非线性激活函数使得模型决策函数具有更强的判别能力。二、 VGG-16D类网络结构讲解D类架构是VGGNet中最经典、应用最广泛的变体其名称中的“16”代表该网络包含16个具有可训练权重的层13个卷积层 3个全连接层。模型输入图像尺寸固定为224 x 224 x 3RGB三通道。块1结构序列卷积 - ReLU - 卷积 - ReLU - 最大池化卷积层包含2个卷积层每层采用64个尺寸为3x3x3的卷积核。步幅Stride设为1填充Padding设为1保持尺寸不变。输出特征图尺寸为 224x224x64。激活函数每层卷积后接入ReLU函数。池化层采用 2x2 的窗口步幅设为2填充为0。此操作将特征图空间尺寸减半输出尺寸为112x112x64。块2结构序列卷积 - ReLU - 卷积 - ReLU - 最大池化卷积层包含2个卷积层每层卷积核数量扩充至128个尺寸仍为3x3。保持步幅1和填充1输出尺寸为 112x112x128。池化层参数同块12x2步幅2输出尺寸为56x56x128。块3结构序列卷积 - ReLU - 卷积 - ReLU - 卷积 - ReLU - 最大池化卷积层包含3个卷积层每层卷积核数量增加至256个尺寸3x3步幅1填充1。输出尺寸为 56x56x256。池化层2x2窗口步幅2输出尺寸为28x28x256。块4结构序列卷积 - ReLU - 卷积 - ReLU - 卷积 - ReLU - 最大池化卷积层包含3个卷积层卷积核数量提升至512个尺寸3x3。步幅1填充1输出尺寸为 28x28x512。池化层2x2窗口步幅2输出尺寸14x14x512。块5结构序列卷积 - ReLU - 卷积 - ReLU - 卷积 - ReLU - 最大池化卷积层包含3个卷积层每层保持512个3x3卷积核。步幅1填充1输出尺寸为 14x14x512。池化层2x2窗口步幅2输出尺寸为7x7x512。块6全连接层结构序列全连接 - ReLU - Dropout - 全连接 - ReLU - Dropout - 全连接 - Softmax第一层展平特征图接入4096个神经元的全连接层后接ReLU激活函数及Dropout丢弃率0.5以防止过拟合。第二层同样为4096个神经元后接ReLU与Dropout。第三层输出层包含1000个神经元对应ImageNet数据集的1000个类别接入Softmax函数输出最终分类概率。VGGNet证明了增加网络深度可以有效提升模型性能