线性回归-误差项分析
当我们⽤线性回归模型去做回归问题时,会接触到误差项这个概念对于⼀个线性回归模型
y(i)=θTxiy^{(i)}=\heta^Tx^{i}y(i)=θTxi
其实往往不能准确预测数据的真实值,这是很正常的,各种各样的因素会使真实值很难符合线性分布,但对于有些数据分布总体会符合线性分布,但不能完全接近,这是很合理的。对于那些很接近线性分布的数据,可以训练模型去尽量的拟合数据。
对于每⼀个样本其实会有这样⼀个公式:
y(i)=θTxi+ε(i)y^{(i)}=\heta^Tx^{i}+\\varepsilon^{(i)}y(i)=θTxi+ε(i)
其中ε(i)\\varepsilon^{(i)}ε(i)就叫做误差项,如果这个误差项分布符合均值为0的正太分布,那么我们就可以认为我们得到的模型是正常的,也就是说得到了⼀个线性回归合理的模型。但要做到这⼀步,跟数据的真实分布是有很⼤关系的。
因篇幅问题不能全部显示,请点此查看更多更全内容