선형 회귀 계산기
일상
선형 회귀는 ‘x가 1만큼 늘면 y는 얼마나 움직이는가?’ 라는 일상적 질문에 답합니다. (x, y) 쌍을 한 줄에 하나씩, 쉼표·탭·공백·세미콜론 어느 것으로 구분하든 붙여 넣으면 이 도구는 최소제곱법으로 y = mx + b 직선을 적합시켜 기울기, 절편, 피어슨 상관계수 r, 결정계수 R², 기울기의 표준오차, 그리고 산점도 위에 적합선을 겹쳐 그려 줍니다. 직선이 데이터를 얼마나 잘 따라가는지 눈으로 즉시 확인할 수 있습니다. 예측 입력란에 임의의 x 값을 입력하면 ŷ가 바로 나오고, 계산은 수치적으로 안정적인 편차 제곱합 형태로 처리되어 두 축의 평균이 분산에 비해 클 때도 정확합니다. 모든 처리는 브라우저 안에서 로컬로 실행되며 데이터는 업로드되지 않습니다.
—
최적 적합선
y = 1.9988 x + 0.0179
적합선
기울기 (m)
1.9988
절편 (b)
0.0179
기울기 표준오차
0.0274
적합 강도
피어슨 r
0.9994
R² (결정계수)
0.9989
피어슨 r
+ 매우 강함
요약
쌍 개수 (n)
8
x 평균
4.5
y 평균
9.0125
예측
예측 ŷ
20.006
데이터 범위에서 너무 벗어나면 외삽 신뢰도가 빠르게 떨어집니다.
산점도와 적합선
피어슨 r 은 선형 관계만 측정합니다. 곡선 관계는 명확히 관련 있어도 r 이 0 에 가까울 수 있으니, 숫자만 보지 말고 산점도를 함께 확인하세요.
사용법
- 한 줄에 한 쌍씩 숫자를 붙여 넣으세요 — 줄의 첫 번째 숫자가 x, 두 번째가 y 입니다. 쉼표·탭·공백·세미콜론 모두 구분자로 인식합니다.
- 헤드라인의 적합 방정식 y = mx + b 를 확인한 뒤, R² 로 y의 변동을 직선이 얼마나 설명하는지 보세요.
- 피어슨 r 의 부호로 방향(양수면 함께 증가, 음수면 반대로 이동)을, 크기(0–1)로 점이 직선에 얼마나 밀착하는지 가늠하세요.
- 예측 입력란에 임의의 x 를 넣으면 ŷ 가 나옵니다. 데이터 범위에서 너무 멀리 외삽하지 마세요.
자주 묻는 질문
- r 과 R² 의 차이는?
- 피어슨 r 은 −1 에서 +1 사이로, 선형 관계의 방향과 강도를 함께 나타냅니다. R² 은 r 의 제곱으로 항상 0–1 사이이며, y의 변동 중 회귀선이 설명하는 비율입니다. r = −0.9 와 r = +0.9 는 모두 R² = 0.81 (분산의 81% 설명)이지만 관계의 방향은 정반대입니다.
- 상관관계는 인과관계인가요?
- 아닙니다. 강한 적합은 표본에서 x와 y가 함께 움직였다는 뜻일 뿐, x가 y의 원인이라는 뜻이 아닙니다. 고전 예: 아이스크림 매출과 상어 공격은 상관(둘 다 여름에 증가)하지만, 아이스크림이 공격을 일으키지는 않습니다. 회귀는 관계를 묘사하는 도구이지 인과를 증명하지 않습니다.
- 선형 회귀가 적합하지 않은 경우는?
- 관계가 곡선일 때(다항 적합 사용), 극단값 몇 개가 직선을 끌어당길 때(산점도에서 이상치 확인), x가 커질수록 분산이 커질 때(이분산), y들 간 독립성이 없을 때입니다. R² 가 높아도 산점도가 명백히 휘어 있다면 다른 모델이 필요합니다.
- 기울기의 표준오차는 무엇을 알려 주나요?
- 직선 주변 잔차로부터 추정한 기울기 m 의 불확실성입니다. 대략적인 95% 신뢰구간은 m ± 2 × SE(m) 입니다. 이 구간이 0을 가로지르면 x와 y가 관련 있다고 자신 있게 말할 수 없습니다 — 데이터가 무관계와도 모순되지 않는다는 뜻입니다.
- 표본 크기는 얼마나 필요한가요?
- 두 점이면 R² = 1 인 정확한 직선이 그려지지만 신뢰도는 알 수 없습니다. 의미 있는 R² 과 표준오차를 위해선 최소 3 개, 신뢰할 만한 기울기 추정엔 10 개 이상, 추론(p값·신뢰구간)까지 하려면 20–30 개 이상이 안전선입니다.