在走进深度学习的过程中,最吸引作者的是一些用于给对象分类的模型。最新的科研结果表示,这类模型已经可以在实时视频中对多个对象进行检测。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第1张

在走进深度学习的过程中,最招引作者的是一些用于给方针分类的模型。***的科研成果表明,这类模型现已能够在实时视频中对多个方针进行检测。而这就要归功于核算机视觉范畴***的技术革新。

众所周知,在曩昔的几年里,卷积神经网络(CNN或ConvNet)在深度学习范畴取得了许多重大打破,但关于大多数人而言,这个描绘是适当不直观的。因而,要了解模型取得了怎样大的打破,咱们应该先了解卷积神经网络是怎样作业的。

卷积神经网络能够做些什么?

卷积神经网络用于在图画中寻觅特征。在CNN的前几层中,神经网络能够进行简略的"线条"和"角"的辨认。咱们也能够经过神经网络向下传递然后辨认更杂乱的特征。这个特点使得CNN能够很好地辨认图画中的方针。

卷积神经网络

CNN是一个包括各种层的神经网络,其间一些层是卷积层、池化层、激活函数。

卷积层是怎么作业的?

要了解CNN怎么作业,你需求了解卷积。卷积触及阅览图画和运用滤波器等详细内容。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第2张

上图是一个5x5的矩阵。现在,你别的选取一个3x3矩阵,然后移动到图画上,将3x3矩阵与被掩盖的图画部分相乘以生成单个值。紧接着,3x3矩阵向右和向下移动以"掩盖"整个图画。***,咱们将取得如上所示的内容。

卷积层的方针是过滤。滤波器是由矢量的权重堆叠乘以卷积输出的值来表明的。当练习图画时,这些权重会发生变化,也就是说当进行图画评价时,它会经过它捕捉到的一些特征来预测出图画的内容。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第3张

池化层

卷积层之后的层首要是CNN架构中的池化层。它将输入的图画分割为一组不堆叠的矩形,而且关于每个子区域都输出一个值。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第4张

两个首要的池化层是***池和均匀池。

***池 - 输出子区域的***值。

均匀池 - 输出子区域的均匀值。

池化层用于削减空间维度而不是深度。

削减空间维度的首要长处是:

  • 经过削减空间信息,能够优化核算功能。
  • 经过削减空间信息意味着你能够运用较少的参数来练习模型,然后削减过度拟合的可能性。
  • 取得一些固定的值。

激活函数

激活函数的作业方法与其他神经网络彻底相同,该函数的首要左右是将值压缩到一个特定的规模内。一些常用的激活函数是:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第5张

最常用的激活函数是ReLu激活函数。它需求输入'x'并判别'x'是否为正,假如不为正则回来0。运用ReLu函数的原因是因为它的履行本钱很低。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第6张

上图是卷积层的一般表明。咱们经过池化层进行了卷积和ReLu函数。这些层互相堆叠。

尽管界说和练习深度神经网络(DNN)比以往任何时候都简单,但大多数人仍是会堕入误区。

为此意图,咱们运用可视化来了解CNN模型中的各种层。

运用Keras完成可视化

在这部分咱们将测验运用Keras完成可视化。咱们将运用Keras可视化输入,***极限地激活VGG16体系结构的不同层中的滤波器,并对ImageNet进行练习。

首要,让咱们从在Keras中界说VGG16模型开端:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第7张

请注意,咱们只进入***一个卷积层。原因是增加彻底衔接的层会强制你运用模型的固定输入巨细(224x224,原始ImageNet格局)。 经过保存卷积模块,咱们的模型能够习惯恣意输入巨细。

该模型加载了一组预先在ImageNet上练习过的权重。

现在让咱们界说一个丢失函数,它将促进特定层(layer_name)中的特定滤波器(filter_index)的激活。咱们经过Keras后端函数履行此操作,该函数支撑咱们的代码在TensorFlow和Theano之上运转。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第8张

一切都很简略。这儿仅有的技巧是标准输入图画的像素梯度,以保证梯度上升满足滑润。

现在咱们能够运用咱们界说的Keras函数在输入空间中进行梯度上升:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第9张

运用TensorFlow在CPU上履行此操作需求几秒钟。

然后咱们能够提取并显现生成的输入:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第10张

成果:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第11张

***层根本上仅仅编码方向和色彩。然后将这些方向和滤波器组合成根本网格和斑驳纹路。这些纹路逐步组合成越来越杂乱的图画。

你能够将每层中的滤波器视为矢量的根底,它通常是完好的,可用于以紧凑的方法将输入层进行编码。当滤波器开端整合来自越来越大的空间规模的信息时,滤波器会变得愈加杂乱。

以下是从不同层生成的要素图的图片:

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第12张

第1层首要生成水平、笔直和对角线。首要用于检测图画中的边际。 第2层将测验供给更多的信息。它首要检测旮旯。第3层咱们开端能够检测到一些杂乱的图画,如眼睛、脸等。咱们能够假定这个特征图是从练习过的人脸检测模型中取得的。在第4层,它能够在面部的更杂乱部分(例如眼睛)。

 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解) 图像识别 神经网络 人工智能 第13张

在第5层中,你能够运用要素图生成人的详细面孔、汽车轮胎、动物的面孔等。此要素图包括有关图画中的大多数信息。

定论

一般来说,CNN和其他图画辨认模型并没有太大差异。咱们能够经过阅览相关书本加深对这方面的了解。

转载请说明出处
知优网 » 把握可视化卷积神经网络模型,带你畅游图像识别技术领域(卷积神经网络可视化理解)

发表评论

您需要后才能发表评论