AZ Tools

线性回归计算器

日常

线性回归回答“x 增加 1 时,y 会变化多少?”这一日常问题。将 (x, y) 数据对按每行一组的方式粘贴(逗号、制表符、空格或分号分隔均可),本工具用最小二乘法拟合 y = mx + b 直线,返回斜率、截距、皮尔逊相关系数 r、决定系数 R²、斜率的标准误差,以及叠加拟合线的散点图,让你直观看到直线对数据的拟合程度。在预测框输入任意 x 即可立刻得到 ŷ。计算采用数值稳定的偏差平方和形式,而非朴素的 Σxy − (Σx)(Σy)/n,使得两轴均值相对方差较大时也能保持精度。所有处理均在浏览器内本地完成,不上传任何数据。

最佳拟合直线

y = 1.9988 x + 0.0179

拟合直线

斜率 (m)

1.9988

截距 (b)

0.0179

斜率标准误差

0.0274

拟合强度

皮尔逊 r

0.9994

R²(决定系数)

0.9989

皮尔逊 r

+ 非常强

概要

数据对 (n)

8

x 均值

4.5

y 均值

9.0125

预测

预测 ŷ

20.006

尽量留在数据范围内——外推越远,可靠性下降越快。

散点图与拟合直线

x: 1 → 8y: 2.02 → 16.2

皮尔逊 r 只测线性相关。曲线关系可能呈 r 近 0,但仍有关联——务必结合散点图判断,不要只看数字。

使用方法

  1. 每行粘贴一对数字——第一个为 x,第二个为 y。逗号、制表符、空格、分号都可作分隔符。
  2. 查看主公式 y = mx + b 与 R²,判断直线解释 y 变动的比例。
  3. 用皮尔逊 r 的符号判断方向(正:同向;负:反向),用绝对值(0–1)判断点对直线的紧密程度。
  4. 在预测框输入任意 x 即得 ŷ——可向数据范围外推一小步,不要外推过远。

常见问题

r 与 R² 的区别?
皮尔逊 r 取值 −1 到 +1,表示线性关系的方向与强度。R² 为 r 的平方,介于 0–1,是 y 变动中被回归线解释的比例。r = −0.9 与 r = +0.9 都对应 R² = 0.81(解释 81% 方差),但方向相反。
相关等于因果吗?
不等于。良好拟合只表示样本中 y 随 x 变动,并不意味着 x 导致 y。经典例:冰淇淋销量与鲨鱼袭击相关(夏季都增加),但冰淇淋并不导致袭击。回归用于描述关系,不证明因果。
线性回归何时不适用?
关系呈曲线(应改用多项式拟合)、少数极端点拉偏直线(散点图中检查异常值)、方差随 x 增大(异方差),或 y 之间不独立。R² 高但散点明显弯曲时需选其他模型。
斜率标准误差表示什么?
由直线周围残差估计的 m 的不确定性。95% 置信区间近似为 m ± 2 × SE(m)。若该区间跨越 0,则不能自信地断言 x 与 y 相关——数据与“无关系”同样兼容。
需要多大样本?
两点可得 R² = 1 的精确直线,但谈不上可靠性。可用的 R² 与标准误差至少需要 3 点,可靠的斜率估计至少 10 点,进行推断(p 值、置信区间)建议 20–30 点以上。

相关工具