線形回帰計算機
暮らし
線形回帰は「x が 1 増えると y はどれだけ動くか?」という日常的な問いに答えます。(x, y) のペアを 1 行に 1 組ずつ、カンマ・タブ・空白・セミコロンのいずれの区切りでも貼り付けると、本ツールは最小二乗法で y = mx + b の直線をフィットし、傾き、切片、ピアソン相関係数 r、決定係数 R²、傾きの標準誤差、そして散布図に直線を重ねたグラフを返します。直線がデータをどれだけうまく追っているか目で確かめられます。予測欄に任意の x を入力すれば対応する ŷ がすぐ表示され、計算は数値的に安定な偏差平方和の形式で行うため、両軸の平均が分散に比べて大きい場合でも精度を保ちます。すべての処理はブラウザ内でローカルに実行され、データは送信されません。
—
最適直線
y = 1.9988 x + 0.0179
最適直線
傾き (m)
1.9988
切片 (b)
0.0179
傾きの標準誤差
0.0274
適合の強さ
ピアソン r
0.9994
R²(決定係数)
0.9989
ピアソン r
+ 非常に強い
サマリ
ペア数 (n)
8
x の平均
4.5
y の平均
9.0125
予測
予測 ŷ
20.006
データ範囲から離れすぎると外挿の信頼性は急速に低下します。
散布図と最適直線
ピアソン r は線形関係しか測りません。曲線関係では明らかに関連があっても r がほぼ 0 になり得ます。数値だけでなく散布図も必ず確認してください。
使い方
- 1 行に 1 ペアずつ数値を貼り付けます — 行の最初の数が x、2 番目が y。カンマ・タブ・空白・セミコロンはすべて区切り文字として扱います。
- ヘッドラインの最適直線 y = mx + b を確認し、R² で y のばらつきのうち直線が説明する割合を見ます。
- ピアソン r の符号で方向(正なら同方向、負なら逆方向)、絶対値(0–1)で点が直線にどれだけ密着しているかを把握します。
- 予測欄に任意の x を入れると ŷ が返ります。データ範囲を大きく外れた外挿は信頼性が急落するので注意。
よくある質問
- r と R² の違いは?
- ピアソン r は −1〜+1 で、線形関係の方向と強さを示します。R² は r² で常に 0〜1、y のばらつきのうち回帰直線が説明する割合です。r = −0.9 と r = +0.9 はどちらも R² = 0.81(分散の 81% を説明)ですが、関係の向きは正反対です。
- 相関は因果関係?
- 違います。強い適合は標本内で x と y が連動して動いたという意味で、x が y の原因とは言えません。古典例:アイスクリーム売上とサメ襲撃は相関する(両方夏に増加)が、アイスクリームが襲撃を引き起こすわけではありません。回帰は関係の記述であって因果の証明ではありません。
- 線形回帰が使えないのはどんなとき?
- 関係が曲線のとき(多項式フィットへ)、少数の極端値が直線を引きずるとき(散布図で外れ値確認)、x が大きいほどばらつきが増えるとき(不等分散)、y 同士が独立でないとき。R² が高くても散布図が明らかに曲がっているなら別モデルが必要です。
- 傾きの標準誤差は何を表す?
- 直線周りの残差から推定した傾き m の不確実性です。おおまかな 95% 信頼区間は m ± 2 × SE(m)。この区間が 0 をまたぐなら、x と y に関係があると自信を持って言えず、データは「無関係」とも矛盾しません。
- 必要なサンプル数は?
- 2 点なら R² = 1 の完全直線が引けますが信頼性は不明。意味のある R² と標準誤差には最低 3 点、信頼できる傾き推定なら 10 点以上、推測(p 値・信頼区間)まで行うなら 20〜30 点以上が安全圏です。