Skip to content

线性神经网络

在探讨线性神经网络部分中,我们需要重点关注整个训练网络建立、训练流程: 大致上可以描述为:建立线性数学模型 - 给定随机初始值并且学习率 - 使用基础优化算法减小MSE

而对于线性神经网络来说,最重要的是基础的优化算法,而线性数学模型是是十分显而易见的:

\[y = w_1x_1 + w_2x_2 +...+w_nx_n + b\]
\[y = W^T x + b\]

而我们需要评估我们训练优化出来的线性模型的准确性,我们考察其MSE结果:

\[L(\mathbf{w}, b) =\frac{1}{n}\sum_{i=1}^n l^{(i)}(\mathbf{w}, b) =\frac{1}{n} \sum_{i=1}^n \frac{1}{2}\left(\mathbf{w}^\top \mathbf{x}^{(i)} + b - y^{(i)}\right)^2.\]

常数\(\frac{1}{2}\)不会带来本质的差别,但这样在形式上稍微简单一些(因为当我们对损失函数求导后常数系数为1)。

线性回归模型过于简单的原因大部分是因为线性回归模型存在解析解。

随机梯度下降算法

我们一般会采用小批量随机梯度下降算法