aboutDL

softmax损失函数

2019-01-29  本文已影响2人  madeirak

softmax常用来进行多分类,假如有一个4x1向量z^{[L]}=[5,2,-1,3],softmax的计算过程如下所示

输入向量z^{[L]}和中间向量t softmax输出向量,结果的所有元素和为1

下式中y是标签,\hat{y} 是输出预测值。假设y=[0,1,0,0],\hat{y} =[0.3,0.4,0.1,0.2]

单个训练样本损失函数L(\hat{y} y)  =  —\sum_{j = 1}^4y_{j} \log_~\hat{y_j}

根据上面的例子,y_{j} j\neq 2时,式子值为0,j=2时,y_{j} =1,综上L(\hat{y} y)=-\log_~\hat{y_j} ,损失函数通过学习变小,\hat{y_j} 则变大,又softmax输出的所有概率和为1,所以理想状态下\hat{y_j} 会趋近于1

下式的\omega ^{(i)}b^{(i)}是softmax需要学习的权重和偏移。

训练集的损失函数J\omega ^{(i)}b^{(i)},... )= \frac{1}{m} \sum_{1}^mL(\hat{y_j} ^{(i)}y^{(i)})

整个训练集损失就是把训练算法对所有训练样本的预测都加起来,再除以样本数。

上一篇 下一篇

猜你喜欢

热点阅读