0%

Error来源

发表于 2021-03-23 分类于 Machine Learning

Error来源

bias - 距靶心距离（准）
variance - 分散程度（稳）

Estimator

均值： $m=\frac{1}{N}\sum x^i$ （上标表示第几个变量）
均值估计： $E[m]=E\big([\frac{1}{N}\sum x^i]\big)=\frac{1}{N}\sum E[x^i]=\mu$
方差： $s^2=\frac{\sigma ^2}{N}=\frac{1}{N}\sum (x^i-m)^2$
方差估计： $E[s^2]=E[\frac{1}{N}\sum (x^i-m)^2]=\frac{N-1}{N}\sigma^2\neq\sigma^2$

variance大 - 过拟合

简单模型受训练数据影响小，Variance小；复杂模型Variance大
方法1：增加数据集（效率低，但并不总是practical）- 不会伤害bias
方法2：对损失函数进行正则化（Regularization），平滑曲线 - 会伤害bias

bias大 - 欠拟合

简单模型bias大，复杂模型bias小。<泰勒展开>，模型越复杂，function set越大
说明model本身设计得就不好/过于简单，导致没有包含目标模型，此时收集更多数据是没有用的，需要重新设计model

var增大，bias减小，需要找到平衡点，使得error最小

Model Selection

Training Set：训练模型
Validation Set：选模型
N-fold Cross Validation（N折交叉验证）

Training Set分成三份，分别作为(train, train, val) (train, val, train) (val, train, train)，模型分别训练三次得到三个error取平均值，选最低error的模型再在整个Training Set上训练一次，得到的结果应用于Testing Set

不要根据Testing Set调整参数！