2.1线性神经网络
2021-04-25 本文已影响0人
纵春水东流
1. 线性回归模型
1.1 模型
单样本:
#为参数,为样本特征
样本集:
#X形状为[n,d],n个d个特征样本集合
损失函数
最佳参数:
#最佳参数为损失函数最小值时的参数
1.2参数的解法
解析解:
梯度下降:
1.3平方损失的由来
假设:
x属于正态分布、y也属于正态分布
#x分布
#y分布
#样本概率
给定参数w,b样本集的概率,其概率最大时的参数就是所需要的解
样本集概率:
概率最大时的解:
等价解:
等价解:
#即平方损失函数最小值
2. softmax 回归
2.1模型
#使得转化后的值非负,和为1,符合概率
单样本:
样本集:
输出:
分类:
#即选择概率最大的那个类
2.2损失函数:
与线性模型相同,最大化概率时的参数w,b即为解
等价:
交叉熵:
2.3softmax 与微分
展开:
对预测值进行偏微分:
偏微分可以区分出这个模型对不同预测值的概率
2.3交叉熵
熵:
交叉熵:
H(P,Q),即给定条件Q下P事件的信息量