相関係数だけで判断することの危うさの例
相関係数だけで判断することの危うさの例をメモ。
相関係数だけで判断することは非常に危険というのは、以下の例がすごくわかりやすいです!
— fkubota ?? (@fkubota_) May 30, 2021
「アンスコムの例」と呼ばれる4つのデータセットがあります。
これ、4つとも平均、分散、相関係数がほぼ一致してるんですよね。
外れ値がいかに危険かもよくわかる。 https://t.co/yzZacrzH4Z pic.twitter.com/SU7ChrL13V
それはまだ序の口。 https://t.co/4A7D4GOaKR pic.twitter.com/6Y1QlGAgxg
— Ken McAlinn (@kenmcalinn) May 30, 2021
相関関係があれば、因果関係があるように錯覚してしまう危険は多い。
システム思考でも、因果ループ図を書く時、最初は2つの変数の時系列グラフから相関関係を見出し、そして、因果関係を抽出する。
売上が増えれば、利益も増える、みたいな感じ。
しかし、実際は相関関係があるからと言って、因果関係が成り立つとは限らない。
打合せの議論を因果ループ図で書き起こしてみると、そういう思い込みが割とある、と気づく。
つまり、バイアスを皆持っている。
バイアスは偏見かもしれないが、何らかの価値観が前提にあるから、ロジックが作られている。
そういう暗黙の因果関係を抽出する時、割と相関関係と因果関係をラフに同一視しているな、と気づく。
| 固定リンク
「統計学・機械学習・深層学習」カテゴリの記事
- ディープラーニングではなぜ微分が重要なのか?(2026.05.09)
- 「資料をそのままAIに食わせたい」を解決するMicrosoft製ツールMarkItDownとは?(2026.04.25)
- なぜ『図解 線形代数: ストラング流直感的理解』は分かりやすいのか?従来の線形代数との決定的な違い(2026.04.25)
- Redmineは組織のナレッジ基盤として実現可能なのか~島津製作所の事例を読み解く #redmineT(2024.12.29)
- 統計学の考え方をastahでまとめた(2023.05.28)


コメント