Regression
2021/03/22
应用:股票预测系统/自动驾驶/推荐系统
Step1:Model = A set of function
Linear Model: , : weight,: bias
Step2:Goodness of Function
Loss Function :input a function, output how bad it is
Regularization 正则化:
其中 是手调的参数,加的一项表示希望参数 越小越好,越接近0越好
参数值接近0的function是比较平滑的,平滑的函数比较受青睐,因为受输入噪声影响越小;但也不能太平滑。 越大,考虑平滑越多
做Regularization不考虑bias比较好,bias只是对function上下移动,对平滑程度没有影响
Step3:Best Function
Gradient Descent 梯度下降法
(随机)选取参数初始值
计算初始位置参数对损失函数的(偏)微分(切线斜率)
为负:增大参数
为正:减小参数
步长(Step Size)取决于当前(偏)微分值,和一个常数项(Learning Rate)
重复2、3的步骤,到达局部最小值,但不一定是全局最小值(线性回归没有这个问题)
Overfitting 过拟合:减少参量;正则化(Step2)