无标题文章
##机器学习初涉本部分总结来自于李弘毅教授的PPT(既然说一天学会机器学习那我就试试吧.....)###大纲1.深度学习简介2.训练深度神经网络的一些要点3.卷积神经网络的变量4.下一个浪潮###深度学习简介:>为什么我们认为深度学习是深度的?>我们如何开始一个最基础的深度学习的项目?**深度学习的目的:**深度学习事实上是想要找到一个函数,尤其适合用来解决线性不可分的问题。**深度学习的框架:**拿图像识别举一个例子,我们有一张猫的图像,我们希望这个函数可以给我们返回一个'cat',事实上我们有一系列的函数,每一个函数可能给出不同的单词(对应同一个图片),那么根据这个图片识别的准或者不准就是这个函数的表现是否是良好的,我们给出了反馈,最终不断的训练我们的解,这就是有监督的学习。深度学习的三个步骤:1.定义一系列的函数2.看函数是否具有优良的性质(识别的准确性)3.挑选出最好的函数在这三个步骤中,我们通常把第一步换成一个卷积神经网络一个最简单的线性感知器模型(神经元的模型):$z = a_1w_1+....a_kw_k+.....a_Kw_K+b$其中的a1...ak就是每一个变量的我们设置的权重,b被称为bias,最终得到的值是z,然后经过一个激活函数$\epsilon(z)$来得到最终的a的取值。通常来讲,在卷积神经网络中,通常选用sigmoid函数来作为整个网络的激活函数(activate function),这个函数的形式如同下图所示:$\epsilon(z)=\frac{1}{1+e^{-z}}$在卷积神经网络中,不同的连接对应着不同的网络的结构,每一个神经元都有着不同的权重和偏差,这个就是网络的参数$\theta$,每一个神经元的后面都跟着一个激活的函数,它的目的就是为了引入非线性,随便选一个就行,只要是非线性的,不同的激活函数存在着不同的优点和缺点,这个需要自行判断。####卷积神经网络**全连接的前馈控制的网络:**通常也叫Fully Connect Feedforward Network这种神经网络的构成一般是由输入层,中间的隐藏层,以及最终的输出层。**深度**这个词的意思就是有很多隐藏的层。输出层的选择一般是softmax layer,为什么我们要选择这个输出层呢?先看一下传统输出层,对于每一个z的求解经过一个激活函数得出遗传的输出变量,大水牛Hi通常来讲,很有可能神经网络的输出可能是任何的值,这样就不太好解释,但是在使用softmax函数时,就有如下的好处,首先理解一下。**softmax函数的构造:**将每一个输出除以所有输出的和并且最终得出相应的比例系数,就像概率一样,每一个输出$y_i$都是有如下的情况:$0