线性回归计算器
日常
线性回归回答“x 增加 1 时,y 会变化多少?”这一日常问题。将 (x, y) 数据对按每行一组的方式粘贴(逗号、制表符、空格或分号分隔均可),本工具用最小二乘法拟合 y = mx + b 直线,返回斜率、截距、皮尔逊相关系数 r、决定系数 R²、斜率的标准误差,以及叠加拟合线的散点图,让你直观看到直线对数据的拟合程度。在预测框输入任意 x 即可立刻得到 ŷ。计算采用数值稳定的偏差平方和形式,而非朴素的 Σxy − (Σx)(Σy)/n,使得两轴均值相对方差较大时也能保持精度。所有处理均在浏览器内本地完成,不上传任何数据。
—
最佳拟合直线
y = 1.9988 x + 0.0179
拟合直线
斜率 (m)
1.9988
截距 (b)
0.0179
斜率标准误差
0.0274
拟合强度
皮尔逊 r
0.9994
R²(决定系数)
0.9989
皮尔逊 r
+ 非常强
概要
数据对 (n)
8
x 均值
4.5
y 均值
9.0125
预测
预测 ŷ
20.006
尽量留在数据范围内——外推越远,可靠性下降越快。
散点图与拟合直线
皮尔逊 r 只测线性相关。曲线关系可能呈 r 近 0,但仍有关联——务必结合散点图判断,不要只看数字。
使用方法
- 每行粘贴一对数字——第一个为 x,第二个为 y。逗号、制表符、空格、分号都可作分隔符。
- 查看主公式 y = mx + b 与 R²,判断直线解释 y 变动的比例。
- 用皮尔逊 r 的符号判断方向(正:同向;负:反向),用绝对值(0–1)判断点对直线的紧密程度。
- 在预测框输入任意 x 即得 ŷ——可向数据范围外推一小步,不要外推过远。
常见问题
- r 与 R² 的区别?
- 皮尔逊 r 取值 −1 到 +1,表示线性关系的方向与强度。R² 为 r 的平方,介于 0–1,是 y 变动中被回归线解释的比例。r = −0.9 与 r = +0.9 都对应 R² = 0.81(解释 81% 方差),但方向相反。
- 相关等于因果吗?
- 不等于。良好拟合只表示样本中 y 随 x 变动,并不意味着 x 导致 y。经典例:冰淇淋销量与鲨鱼袭击相关(夏季都增加),但冰淇淋并不导致袭击。回归用于描述关系,不证明因果。
- 线性回归何时不适用?
- 关系呈曲线(应改用多项式拟合)、少数极端点拉偏直线(散点图中检查异常值)、方差随 x 增大(异方差),或 y 之间不独立。R² 高但散点明显弯曲时需选其他模型。
- 斜率标准误差表示什么?
- 由直线周围残差估计的 m 的不确定性。95% 置信区间近似为 m ± 2 × SE(m)。若该区间跨越 0,则不能自信地断言 x 与 y 相关——数据与“无关系”同样兼容。
- 需要多大样本?
- 两点可得 R² = 1 的精确直线,但谈不上可靠性。可用的 R² 与标准误差至少需要 3 点,可靠的斜率估计至少 10 点,进行推断(p 值、置信区间)建议 20–30 点以上。