300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 深度学习入门——前馈神经网络

深度学习入门——前馈神经网络

时间:2020-11-04 12:04:49

相关推荐

深度学习入门——前馈神经网络

前馈神经网络作为深度学习基础中的基础,是很多同学入门深度学习的必经之路。由于马上要迎来考试复习周,在这里简单记录一下学习心得。

感知机模型

感知机(perceptron)是深度学习中最基本的元素,很多模型的构成需要它的参与。感知机的结构如下:

其中X1,X2... Xn为模型输入,每一个Xi代表了一个特征。在上图的模型中,其接收了4个特征作为输入。Y为模型输出,给出模型分类结果。其中间计算过程如下:

其中为权重向量,为偏置。等同于。sign为符号函数,其计算方法如下:

其作用是将计算结果按照任务要求分为两类。

感知机模型的工作过程可以简单的理解为接收特征作为输入,通过权重和偏置与特征进行计算,并不断调整权重值和偏置值,对目标进行分类。

感知机模型可以学习出一下几种分类方式:

对于一个两个特征的样本的二分类问题,其数据和分类可以可视化在一个平面上。

(1)与门

输入和输出的关系如下:

可以可视化为:

感知机模型可以很轻松的通过一条直线将两类区分,图中的斜线为感知机模型产生的分类线。

(2)或门

输入和输出的关系如下:

可以可视化为:

感知机模型同样可以通过一条直线将样本分为两类。

(3)异或门

输入和输出的关系如下:

可以可视化为:

由图可以看出感知机模型不能够通过一条直线将样本分为两类,那么需要如何应对此类的分类问题呢?

我们已知异或门是由与门和或门拼接组成,其组成结构可以视为:

因此,只需要采用两层的感知机结构就可以解决异或问题。分类结果可以可视化为:

此外,对于更复杂的分类问题,多层感知机模型在理论上都可以找到分类方法。而通过堆叠多层感知机,就得到了我们要讲的前馈神经网络。

前馈神经网络

为了让多层感知机模型进行可以自主优化,需要引入反向传播算法。反向传播算法使多层神经网络成为了可能,算法具体内容可以参考:反向传播算法。

其中输入层接收输入数据,隐藏层会逐层提取提取数据特征,再在输出层上分类输出。其中每一个细胞的工作原理都与感知机模型相似。模型计算方法如下:

其中为激活函数。在没有激活函数时,模型的输出只会是输入的线性组合。而激活函数可以引入非线性因素,使模型输出更加复杂,从而提升模型的表达能力。

在这里总结一下我对激活函数作用的简单理解。在未添加激活函数时,在二维平面上的分类线只会是直线的组合。当数据集需要用到特定的曲线进行分类时,比如分类曲线形状可能类似字母“S”,那么需要堆叠很多层的神经网络来产生很多小段直线去拟合“S”曲线。在添加激活函数后,模型本身的输出就是非线性的,因此在二维平面上的分类线可以是曲线。只需要较少层数的神经网络就可以完成对上述任务的拟合。

常见的激活函数有Sigmoid,Relu,tanh等,之后有机会闲下来再总结。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。