模型预测 24-02-23 09:35
微博认证:财经知识分享官 微博原创视频博主

大数据分析的最基础的工具:线性回归。

1. 普通最小二乘法 (OLS) 回归:旨在找到描述因变量(通常表示为 Y)和自变量(表示为 X1、X2、...、Xn)之间关系的最佳拟合线性方程。

2. OLS 通过最小化观察到的因变量值与线性模型预测的因变量值之间的差异的平方和来实现这一点。这些差异称为“残差”。

3. 在OLS的上下文中,“最佳拟合”意味着残差的平方和尽可能小。从数学上讲,它是关于找到 β0、β1、...、βn 的值,使这个总和最小化。

4. 斜率 (β1, β2, ..., βn):这些系数表示因变量的变化,在保持其他变量不变的情况下,相应自变量变化一个单位。

5. R 平方 (R²):此统计量衡量因变量中可从自变量预测的方差比例。它的范围从 0 到 1,值越高表示模型与数据的拟合度越高。

6. t 统计量和 p 值:对于每个系数,t 统计量及其关联的 p 值检验系数等于零(无影响)的原假设。较小的 p 值 (< 0.05) 表示可以否定原假设。

7. 置信区间:这些区间为每个系数提供了一系列合理的值(通常在 95% 置信水平)。

发布于 广东