« Slack導入がDXに繋がる話 | トップページ | MS PlannerはRedmineと違って使いにくいのは複雑なワークフロー管理ができないから »

2021/10/10

計量経済学における統計上の根本問題

Rによる計量経済学 第2版を読んでいたら、興味深いことが書かれていたので、考えたことをメモ。

【1】経済学の実証が物理や科学の実験と異なる点は、経済現象は実験室で観察できないこと。
社会や人間をこちらの指示通りに配置したり、再現性があるように何度も繰り返し実験することができない。
採取できた政府の統計データすら、すでにバイアスが紛れ込んでいる。

また、取得できるデータは受け身になっている。
自分たちから積極的にデータを採取することは、昨今のSaaSやSNSのおかげで、大量のデータをビジネスの副産物として採取できる。
しかし、それらはまだ一部に限られていて、世の中にあふれているデータを元に、自分で収集して分析する場合も多い。
すると、それらのデータにはバイアスが紛れ込んでいて、そのままでは使えない。
パネルデータ分析に使おうとするなら、その前提に合うようにデータを精製しなければならない。

Rによる計量経済学 第2版で最も考えさせられたことは、経済現象の分析にあたって、誤差が古典的最小二乗法でおかれる仮定を満たさない場合が多いということだ。
よって、生データのままでは、回帰分析すら行えなくなる。

実際、新聞やネットニュースでいろんな統計データを元にした意見や主張が出てくるが、そもそも古典的最小二乗法を満たさない場合の考慮を踏まえて、正しい推定が行われているのか、疑問に思える場合がかなり多い気がする。
奥村先生のツイートを読んでいると、そう感じる時がある。

(3) Haruhiko OkumuraさんはTwitterを使っています 「RT @M123Takahashi: 通常の最小二乗法では,誤差項の正規性の仮定が満たされていなくても,中心極限定理により,大標本なら統計的推測に問題は起きないとされています.具体的に標本がどれぐらい大きければよいかについて,この論文では1変数あたり観測値10以上あればよいとしています.(続く)」 / Twitter

【2】古典的最小二乗法の仮定は下記の5つがある。

1・誤差はプラス側やマイナス側に偏らない
2・誤差同士の大きさに関係がない。(自己相関なし)
3・誤差の大きさの平均は一定。(均一分散)
4・誤差と説明変数の大きさに関係がない
5・誤差は正規分布に従う

しかし、経済現象を考えると、この5つの過程を満たさない具体例が簡単に見つかる。

1・誤差はプラス側やマイナス側に偏らない

生産における投入と産出の関係を分析する時に発生する問題。
投入量と産出量には物理的関係がある。
生産プロセスでは何らかのロスが発生するので、物理的生産可能量を基準にすると、回帰分析の誤差はマイナス側だけ発生する。

2・誤差同士の大きさに関係がない。(自己相関なし)

時系列データを分析する時に発生する問題。
データの発生に順番があるので、過去データが直近であるほど現在のデータに影響を与えてしまい、後のデータの誤差に影響を与える。
指数平滑法を連想する。

経済活動では瞬時に終了することはないので、一定期間が必要になる。
そのため、前期のデータが後期のデータに影響し、自己相関の現象が発生しやすい。
経済学では時系列データが多いので、自己相関をいかに排除するか、に注力しているように思える。

3・誤差の大きさの平均は一定。(均一分散)

クロスセクションデータを扱う時に発生する問題。
たとえば、ある国のデータを集めると、大国と小国では規模が異なるので、大国の方が誤差が大きくなる。
つまり、誤差分散の大きさは一定ではない。
経済学では、大国と小国、大企業と中小企業などのデータが混じっていて比較するから、不均一分散の考慮も重要になる。

たとえば、パネルデータ分析では、仮定2と3、つまり、自己相関なしと均一分散の仮定を満たす必要がある。

4・誤差と説明変数の大きさに関係がない

連立方程式体系の経済モデルを扱う時に発生する問題。
市場の分析では、需要関数と供給関数が均衡を決定する時にお互いに影響し合うので、誤差と説明変数に影響が出てしまう。

たとえば、需要均衡など市場で数量と価格が決定される場合など、経済が複数の関数で表現される構造を保つ場合、回帰式に現れる誤差の大きさは、様々な影響を受けて決定される。
その結果、説明変数との間に関係を持ってしまうので、古典的最小二乗法では正しい推定ができない。
つまり、回帰分析に正当性がなくなる。

5・誤差は正規分布に従う

正規分布は左右対称であるが、定性的尺度(働く=0、働かない=1)、比率(耐久財の普及率)ではそのままでは満たさない。

【3】僕は計量経済学の知識不足だが、古典的最小二乗法の仮定を満たさない場合にどこまで推定できるのか、古典的最小二乗法を部分的に満たすような場合はどこまで推定できるのか、を直近30年くらいで研究が進められているように思える。

信頼性革命や構造推定は、たぶんそういう流れの研究ではないか。

経済学は信頼性革命や構造推定により大きく変貌している: プログラマの思索

そんなことを考えると、大量データをクラウドやプログラムで簡単に統計分析できる現在、計量経済学は非常に面白い分野になっていると思う。
IT技術者は積極的にこの分野に関わってもいいと思う。
なぜなら、IT技術者はすでにツールを持っているので、実際の生データを片っ端から分析してみることで、統計学を習得できるからだ。小難しい理論は後から理解すればよい。
具体例をたくさん経験した後で、統計学の本を読み直せば、自分の経験を整理するだけで簡単に理論を生身の知識として理解できるからだ。

今は面白い時代になっているのだろうと思う。

|

« Slack導入がDXに繋がる話 | トップページ | MS PlannerはRedmineと違って使いにくいのは複雑なワークフロー管理ができないから »

経済学・ERP・財務会計」カテゴリの記事

統計学・機械学習・深層学習」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« Slack導入がDXに繋がる話 | トップページ | MS PlannerはRedmineと違って使いにくいのは複雑なワークフロー管理ができないから »