相関係数だけで判断することの危うさの例
相関係数だけで判断することの危うさの例をメモ。
相関係数だけで判断することは非常に危険というのは、以下の例がすごくわかりやすいです!
— fkubota ?? (@fkubota_) May 30, 2021
「アンスコムの例」と呼ばれる4つのデータセットがあります。
これ、4つとも平均、分散、相関係数がほぼ一致してるんですよね。
外れ値がいかに危険かもよくわかる。 https://t.co/yzZacrzH4Z pic.twitter.com/SU7ChrL13V
それはまだ序の口。 https://t.co/4A7D4GOaKR pic.twitter.com/6Y1QlGAgxg
— Ken McAlinn (@kenmcalinn) May 30, 2021
相関関係があれば、因果関係があるように錯覚してしまう危険は多い。
システム思考でも、因果ループ図を書く時、最初は2つの変数の時系列グラフから相関関係を見出し、そして、因果関係を抽出する。
売上が増えれば、利益も増える、みたいな感じ。
しかし、実際は相関関係があるからと言って、因果関係が成り立つとは限らない。
打合せの議論を因果ループ図で書き起こしてみると、そういう思い込みが割とある、と気づく。
つまり、バイアスを皆持っている。
バイアスは偏見かもしれないが、何らかの価値観が前提にあるから、ロジックが作られている。
そういう暗黙の因果関係を抽出する時、割と相関関係と因果関係をラフに同一視しているな、と気づく。
| 固定リンク
「統計学・機械学習・深層学習」カテゴリの記事
- 統計学の考え方をastahでまとめた(2023.05.28)
- ランダム化比較試験はなぜ注目されて利用されるようになったのか(2023.04.08)
- ChatGPTで起きている事象の意味は何なのか(2023.04.02)
- 過学習に陥った人間や社会の事例は何があるのか(2023.01.09)
- 計量政治学と計量経済学の考え方の違い(2022.10.02)
コメント