AZ Tools

선형 회귀 계산기

일상

선형 회귀는 ‘x가 1만큼 늘면 y는 얼마나 움직이는가?’ 라는 일상적 질문에 답합니다. (x, y) 쌍을 한 줄에 하나씩, 쉼표·탭·공백·세미콜론 어느 것으로 구분하든 붙여 넣으면 이 도구는 최소제곱법으로 y = mx + b 직선을 적합시켜 기울기, 절편, 피어슨 상관계수 r, 결정계수 R², 기울기의 표준오차, 그리고 산점도 위에 적합선을 겹쳐 그려 줍니다. 직선이 데이터를 얼마나 잘 따라가는지 눈으로 즉시 확인할 수 있습니다. 예측 입력란에 임의의 x 값을 입력하면 ŷ가 바로 나오고, 계산은 수치적으로 안정적인 편차 제곱합 형태로 처리되어 두 축의 평균이 분산에 비해 클 때도 정확합니다. 모든 처리는 브라우저 안에서 로컬로 실행되며 데이터는 업로드되지 않습니다.

최적 적합선

y = 1.9988 x + 0.0179

적합선

기울기 (m)

1.9988

절편 (b)

0.0179

기울기 표준오차

0.0274

적합 강도

피어슨 r

0.9994

R² (결정계수)

0.9989

피어슨 r

+ 매우 강함

요약

쌍 개수 (n)

8

x 평균

4.5

y 평균

9.0125

예측

예측 ŷ

20.006

데이터 범위에서 너무 벗어나면 외삽 신뢰도가 빠르게 떨어집니다.

산점도와 적합선

x: 1 → 8y: 2.02 → 16.2

피어슨 r 은 선형 관계만 측정합니다. 곡선 관계는 명확히 관련 있어도 r 이 0 에 가까울 수 있으니, 숫자만 보지 말고 산점도를 함께 확인하세요.

사용법

  1. 한 줄에 한 쌍씩 숫자를 붙여 넣으세요 — 줄의 첫 번째 숫자가 x, 두 번째가 y 입니다. 쉼표·탭·공백·세미콜론 모두 구분자로 인식합니다.
  2. 헤드라인의 적합 방정식 y = mx + b 를 확인한 뒤, R² 로 y의 변동을 직선이 얼마나 설명하는지 보세요.
  3. 피어슨 r 의 부호로 방향(양수면 함께 증가, 음수면 반대로 이동)을, 크기(0–1)로 점이 직선에 얼마나 밀착하는지 가늠하세요.
  4. 예측 입력란에 임의의 x 를 넣으면 ŷ 가 나옵니다. 데이터 범위에서 너무 멀리 외삽하지 마세요.

자주 묻는 질문

r 과 R² 의 차이는?
피어슨 r 은 −1 에서 +1 사이로, 선형 관계의 방향과 강도를 함께 나타냅니다. R² 은 r 의 제곱으로 항상 0–1 사이이며, y의 변동 중 회귀선이 설명하는 비율입니다. r = −0.9 와 r = +0.9 는 모두 R² = 0.81 (분산의 81% 설명)이지만 관계의 방향은 정반대입니다.
상관관계는 인과관계인가요?
아닙니다. 강한 적합은 표본에서 x와 y가 함께 움직였다는 뜻일 뿐, x가 y의 원인이라는 뜻이 아닙니다. 고전 예: 아이스크림 매출과 상어 공격은 상관(둘 다 여름에 증가)하지만, 아이스크림이 공격을 일으키지는 않습니다. 회귀는 관계를 묘사하는 도구이지 인과를 증명하지 않습니다.
선형 회귀가 적합하지 않은 경우는?
관계가 곡선일 때(다항 적합 사용), 극단값 몇 개가 직선을 끌어당길 때(산점도에서 이상치 확인), x가 커질수록 분산이 커질 때(이분산), y들 간 독립성이 없을 때입니다. R² 가 높아도 산점도가 명백히 휘어 있다면 다른 모델이 필요합니다.
기울기의 표준오차는 무엇을 알려 주나요?
직선 주변 잔차로부터 추정한 기울기 m 의 불확실성입니다. 대략적인 95% 신뢰구간은 m ± 2 × SE(m) 입니다. 이 구간이 0을 가로지르면 x와 y가 관련 있다고 자신 있게 말할 수 없습니다 — 데이터가 무관계와도 모순되지 않는다는 뜻입니다.
표본 크기는 얼마나 필요한가요?
두 점이면 R² = 1 인 정확한 직선이 그려지지만 신뢰도는 알 수 없습니다. 의미 있는 R² 과 표준오차를 위해선 최소 3 개, 신뢰할 만한 기울기 추정엔 10 개 이상, 추론(p값·신뢰구간)까지 하려면 20–30 개 이상이 안전선입니다.

관련 도구