CV_3线性分类器（下）

Mon 2022.7.25 约 644 字预计阅读 2 分钟

线性分类器（下）

含义：对模型的偏好设置

情景：如果有多个$W$均可得到最优的损失函数，该如何选择？

定义： $$ L(w)=\frac{1}{N}\sum_{i}L_i(f(x_i,W),y_i)+\lambda R(W) $$

$\lambda$为超参数：正则项所占比重——学习前设置

$W$参数——通过学习得到

$L_2$正则项——喜欢对于大数值权值惩罚，喜欢分散权值，鼓励分类器使用全部特征 $$ R(W)=\sum_k\sum_lW_{kl}^2\quad\quad(每项平方后求和) $$
$L_1$正则项
弹性网络：$\alpha L_1 + \beta L_2$

利用所有/部分（小批量梯度下降）/单个（随机梯度下降）计算损失并更新梯度

伪代码：

while True:
	权值梯度 <- 计算梯度（损失， 样本， 权重）
	权值 <- 权值 - 学习率 * 梯度

方法：

数值法：利用导数定义（一般用于检查梯度，速度慢） $$ \frac{dL(W)}{dW} = \lim_{h \to 0}\frac{L(W+h)-L(W)}{h} $$
解析法：利用求导，速度快易出错

术语介绍：

划分手段：

K折交叉验证/带打乱的K折交叉验证

tips:3,4不常用于神经网络分类器