記述統計計算機
暮らし
実際のデータ分析の問いは大抵 2 つに集約されます ― 中心はどこか、どれだけばらついているか。本計算機はその両方を一度に出します。カンマ・空白・改行のいずれかで区切られた数値を貼り付けるだけで、件数、合計、中心傾向 3 種(平均・中央値・最頻値)、五数要約(最小・Q1・中央値・Q3・最大)、四分位範囲 IQR、標本/母集団の分散と標準偏差、定義可能な場合の幾何平均・調和平均、変動係数(CV)、標本歪度(skewness)まで一気に求めます。スプレッドシートの STDEV/QUARTILE 関数をいちいち呼び出す必要はなく、分母が N か N − 1 かを毎回確かめる必要もありません。四分位は線形補間(numpy のデフォルト、Excel の QUARTILE.INC と同一)で計算します。すべての計算はブラウザ内でローカルに実行され、データは送信されません。
—
中心傾向
件数 (n)
10
合計
159
平均
15.9
中央値
15.5
最頻値
4, 8, 16, 23 (×2)
ばらつき
最小値
4
最大値
42
範囲
38
分散(標本)
132.3222
分散(母集団)
119.09
標準偏差(標本)
11.5031
標準偏差(母集団)
10.9128
変動係数 (CV)
72.35%
四分位 & IQR
Q1(25 パーセンタイル)
8
中央値 (Q2)
15.5
Q3(75 パーセンタイル)
21.25
IQR(Q3 − Q1)
13.25
その他の指標
幾何平均
12.4203
調和平均
9.5018
歪度(標本)
1.29
緑色で強調されている値は標本ベースの式で、推測統計の既定です。CV(変動係数)は単位がなく、スケールの異なるデータ間のばらつき比較に便利です。
使い方
- データを貼り付けます ― カンマ・空白・セミコロン・改行のどれでも区切り文字として認識し、数値でないトークンは無視されます。
- 中心傾向ブロック(平均・中央値・最頻値)で分布の中心位置を把握します。
- ばらつきブロック(標準偏差・分散・範囲・変動係数)でデータが平均の周りにどれだけ集中しているかを確認します。
- 四分位ブロックは五数要約です。Q1 − 1.5 × IQR や Q3 + 1.5 × IQR の外側にある値は Tukey 基準の外れ値候補です。
よくある質問
- 標本標準偏差と母集団標準偏差はどちらを使うべき?
- より大きな母集団から取り出した標本で母集団のばらつきを推定したい場合は標本(N − 1 で割る)― スプレッドシート・統計教科書・大半の科学ソフトウェアの既定です。手元の数値が母集団そのもの(例:あるクラス全員の成績を一般化せず記述するだけ)のときだけ母集団(N で割る)を使います。
- なぜ「最頻値なし」と表示されることがあるの?
- すべての値が 1 回ずつしか出てこない場合、「最も頻繁な値」は存在しないため、本計算機は「最頻値なし」と表示します。一部の教科書はその場合に全値を最頻値と扱いますが、実用上は「なし」のほうが分かりやすい表示です。
- 四分位の計算方法は?
- ソート済みの値の間を線形補間する (N − 1) × q 位置の方式です。numpy.quantile の既定値で、Excel の QUARTILE.INC と同じです。Excel の QUARTILE.EXC や R の Type 6 などは、小さなデータセットでわずかに異なる値を返します。
- 変動係数(CV)は何を表す?
- 標準偏差を平均のパーセンテージで表したものです。単位やスケールの異なるデータ間でばらつきを比較できます。「月次売上の CV 10%」と「部品重量の CV 10%」は、絶対標準偏差が違っても相対的ばらつきは同じという意味です。
- 幾何平均・調和平均が空欄になるのはなぜ?
- どちらもすべての値が正のときだけ定義されます。幾何平均は値の積、調和平均は逆数の和を使うためです。0 や負の数が混ざる場合、誤解を招く数値を出すかわりに空欄のままにしています。