softmax and overfitting
2018-05-24 本文已影响0人
遇见百分百
softmax这个结果就可以描述为每个类的概率
softmax这个结果可以描述为每个类的概率
故,不会造成学习慢!是根据信息熵的概念进行求解。
Overfitting
例如我们利用1000个数据作为训练,表现出的情况:
Cost表现看起来还不错,Test的变化如下:
当然了还有其他的方式来客服Overfitting
实验证明一下:
softmax这个结果可以描述为每个类的概率
故,不会造成学习慢!是根据信息熵的概念进行求解。
Overfitting
例如我们利用1000个数据作为训练,表现出的情况:
Cost表现看起来还不错,Test的变化如下:
当然了还有其他的方式来客服Overfitting
实验证明一下: