相関係数だけで判断することの危うさの例
相関係数だけで判断することの危うさの例をメモ。
相関係数だけで判断することは非常に危険というのは、以下の例がすごくわかりやすいです!
— fkubota ?? (@fkubota_) May 30, 2021
「アンスコムの例」と呼ばれる4つのデータセットがあります。
これ、4つとも平均、分散、相関係数がほぼ一致してるんですよね。
外れ値がいかに危険かもよくわかる。 https://t.co/yzZacrzH4Z pic.twitter.com/SU7ChrL13V
それはまだ序の口。 https://t.co/4A7D4GOaKR pic.twitter.com/6Y1QlGAgxg
— Ken McAlinn (@kenmcalinn) May 30, 2021
相関関係があれば、因果関係があるように錯覚してしまう危険は多い。
システム思考でも、因果ループ図を書く時、最初は2つの変数の時系列グラフから相関関係を見出し、そして、因果関係を抽出する。
売上が増えれば、利益も増える、みたいな感じ。
しかし、実際は相関関係があるからと言って、因果関係が成り立つとは限らない。
打合せの議論を因果ループ図で書き起こしてみると、そういう思い込みが割とある、と気づく。
つまり、バイアスを皆持っている。
バイアスは偏見かもしれないが、何らかの価値観が前提にあるから、ロジックが作られている。
そういう暗黙の因果関係を抽出する時、割と相関関係と因果関係をラフに同一視しているな、と気づく。
| 固定リンク
「統計学・機械学習・深層学習」カテゴリの記事
- メトリクス分析のコツは良いIssueを見つけること(2022.06.29)
- 「完全独習 統計学入門」は良い本らしい(2022.06.14)
- 経済学や心理学の実験で得られた理論は再現性があるのか?~内的妥当性と外的妥当性の問題点がある(2022.06.04)
- Rによる計量経済学/計量政治学を読んでいる(2022.04.23)
- 戦略/組織/人事と組織の経済学シリーズを読んでいる(2022.04.23)
コメント