기술 통계 계산기
일상
현실의 데이터 질문은 보통 두 가지로 귀결됩니다 — 중심은 어디이고, 얼마나 퍼져 있는가. 이 계산기는 둘 다 한 번에 답합니다. 쉼표·공백·줄바꿈 어느 것으로 구분된 숫자도 인식해 개수, 합계, 중심 경향 3종(평균·중앙값·최빈값), 다섯 수치 요약(최소·Q1·중앙값·Q3·최대), 사분위 범위 IQR, 표본·모집단 분산과 표준편차, 정의 가능한 경우의 기하평균·조화평균, 변동계수(CV), 표본 왜도(skewness)까지 한꺼번에 산출합니다. 스프레드시트의 STDEV·QUARTILE 함수를 일일이 호출하지 않아도, 그리고 N으로 나누는지 N − 1로 나누는지 매번 헷갈리지 않아도 됩니다. 사분위는 선형 보간(numpy 기본값, Excel QUARTILE.INC와 동일) 방식으로 계산합니다. 모든 계산은 브라우저 안에서 로컬로 실행되며 값이 업로드되지 않습니다.
중심 경향
개수 (n)
10
합계
159
평균
15.9
중앙값
15.5
최빈값
4, 8, 16, 23 (×2)
산포
최솟값
4
최댓값
42
범위
38
분산 (표본)
132.3222
분산 (모집단)
119.09
표준편차 (표본)
11.5031
표준편차 (모집단)
10.9128
변동계수 (CV)
72.35%
사분위 & IQR
Q1 (25 백분위)
8
중앙값 (Q2)
15.5
Q3 (75 백분위)
21.25
IQR (Q3 − Q1)
13.25
기타 지표
기하평균
12.4203
조화평균
9.5018
왜도 (표본)
1.29
초록색으로 강조된 값은 표본 기반 공식으로, 추론 통계의 기본 선택입니다. CV(변동계수)는 단위가 없어 스케일이 다른 데이터 간 산포 비교에 유용합니다.
사용법
- 데이터를 붙여 넣으세요 — 쉼표·공백·세미콜론·줄바꿈 중 어느 것이든 구분자로 인식하며, 숫자가 아닌 토큰은 무시됩니다.
- 중심 경향 블록(평균·중앙값·최빈값)으로 분포의 가운데 위치를 파악하세요.
- 산포 블록(표준편차·분산·범위·변동계수)으로 데이터가 평균 주변에 얼마나 모여 있는지 가늠하세요.
- 사분위 블록은 다섯 수치 요약입니다. Q1 − 1.5 × IQR 또는 Q3 + 1.5 × IQR 바깥에 있는 값은 Tukey 기준의 이상치 후보입니다.
자주 묻는 질문
- 표본 표준편차와 모집단 표준편차는 언제 무엇을 써야 하나요?
- 큰 모집단에서 뽑은 표본이고 모집단의 산포를 추정하려는 경우라면 표본(N − 1로 나눔)을 씁니다 — 스프레드시트·통계 수업·대부분 과학 소프트웨어의 기본값입니다. 가지고 있는 숫자가 전체 모집단(예: 어떤 반 전 학생의 점수 그 자체를 묘사할 뿐, 일반화하지 않을 때)일 때만 모집단(N으로 나눔)을 씁니다.
- 왜 가끔 ‘최빈값 없음’이라고 나오나요?
- 모든 값이 정확히 한 번만 등장하면 ‘가장 자주 나오는 값’이 없으므로 이 계산기는 ‘최빈값 없음’으로 표시합니다. 일부 교과서는 모든 값을 최빈값으로 간주하기도 하지만, 실무에서는 ‘없음’이 더 유용한 표시 방식입니다.
- 사분위 계산 방법은 무엇인가요?
- 정렬된 값 사이를 선형 보간하는 (N − 1) × q 위치 방식입니다. numpy.quantile의 기본값이자 Excel QUARTILE.INC와 같습니다. Excel의 QUARTILE.EXC, R의 Type 6 방식 등은 데이터가 적을 때 결과가 약간 다를 수 있습니다.
- 변동계수(CV)는 무엇을 알려 주나요?
- 표준편차를 평균의 백분율로 표현한 값입니다. 단위나 스케일이 다른 데이터끼리 산포를 비교할 수 있습니다. ‘월 매출의 CV 10%’와 ‘위젯 무게의 CV 10%’는 절대 표준편차가 달라도 상대적 산포는 같다는 뜻입니다.
- 기하평균·조화평균이 빈 칸으로 나오는 이유는?
- 두 값 모두 모든 데이터가 양수일 때만 정의됩니다. 기하평균은 값의 곱을, 조화평균은 역수의 합을 사용하기 때문입니다. 0이나 음수가 섞이면 잘못된 숫자 대신 빈 칸으로 둡니다.