自然科学

2024/04/21

物理学の各分野の基本思想

最近、物理学の各分野の本を片っ端から読んでいる。
こういう基本的な考え方が分かっていないから、ずっとつまずいていたんだな、と気付きがあった。
自分の気づきをラフにメモしておく。
間違っていたら後で直す。

【参考】
物理学の基本思想とは何なのか: プログラマの思索

【1】電磁気学の基本思想は、マクスウェル方程式の理解にある。
マクスウェル方程式は4つあるけれど、微分形式で表現される法則はわかりにくい。
∇、rot、divなどが出てきて混乱する。
よくわかる電磁気学」「ゼロから学ぶ電磁気学」なども良い本なのだろうが、僕には直観的でなくて受け付けにくかった。

むしろ「高校数学でわかるマクスウェル方程式」で説明されている通り、積分形式でマクスウェル方程式を表現するほうが直観的で理解しやすい。
線積分、面積分が出てくるので慣れも必要だが、微小な線分、面積、体積に対し電流や電場、磁場がどのように変化するか、をぐるっと合計して、最終的に積分すれば、マクスウェル方程式が出てくる。
微分形式は、積分形式のマクスウェル方程式を微小な空間で考えるだけで十分。

マクスウェル方程式が分かれば、ローレンツ力や特殊相対性理論との関係性も計算して導くことができる。
高校数学でわかる相対性理論」で説明してくれている。

【2】解析力学の基本思想は、ラグランジアンとハミルトニアンの理解にある。
特にハミルトニアンが重要。
ハミルトニアンの正準方程式、そして、最終的にはハミルトン・ヤコビの方程式まで出せればいい。
ゼロから学ぶ解析力学」「よくわかる解析力学」を読んで納得した。

【3】流体力学の基本思想では、流線と圧力(揚力)を複素関数で表すことにある。
速度ポテンシャル、流れ関数のいずれも偏微分すれば速度が出てくる。
そこから、オイラーの定理、ベルヌーイの定理、ジッタジェーコフスキーの定理が出てくる。
はじめての解析学 微分、積分から量子力学まで」では、流体力学では流線と圧力の2つの変数を複素関数として表現することで、障害物の流線を表現でき、最終的に飛行機の翼と空気の流れを計算するという流れになる。
高校数学でわかる流体力学 ベルヌーイの定理から翼に働く揚力まで」では、障害物のある流速から揚力が生まれる説明を計算式と一緒に丁寧に説明してくれているので理解しやすい。

【4】量子力学の基本思想は、シュレディンガー方程式の理解にある。
電子の位置を知りたいが、実際は確率でしか分からない。
位置を把握する確率は、確率密度関数で決まる。
確率密度関数は波動関数で表現される。
波動関数はシュレディンガー方程式から導かれる。
はじめての解析学 微分、積分から量子力学まで」では、そういう流れが基本にあって、ハミルトニアンやポアソン括弧、演算子の量子化、飛び飛びのエネルギーが出てくると説明してくれている。
ゼロから学ぶ量子力学 普及版 量子世界への、はじめの一歩」ではその説明をお約束として前提としている。
はじめての解析学 微分、積分から量子力学まで」では、量子力学を解析学が最終的に定式化する説明として、最終的に、シュレディンガー方程式とヒルベルト空間が1対1に対応すること、物理量がエルミート作用素に1対1に対応することを説明してくれている。
ただし、量子力学は奥が深いので、これだけでは不十分。
よくわかる量子力学」で最終的に習得が必要かなと思う。

【5】特殊相対性理論の基本思想は、ローレンツ変換に対し、従来の古典力学の見方とアインシュタインの見方が決定的に異なる点を理解することにある。
ゼロから学ぶ相対性理論」では、ローレンツ収縮の話は古典力学の観点からも出てくるが、アインシュタインの考え方が独創的である点を丁寧に説明してくれている。
また、ミンコフスキー空間の考え方も独特だが、「ゼロから学ぶ相対性理論」では、ローレンツ変換後の座標をへしゃげる(回転させる・少しだけ潰す)という比喩が理解しやすかった。

【6】統計力学の基本思想は、温度・圧力・熱量のようなマクロな物理量とアボカドロ数もの膨大な数の分子の運動を結びつける時にエントロピーが橋渡しする点にある。
ボルツマンの定理がエントロピーと場合の数を橋渡しする。
高校数学でわかるボルツマンの原理―熱力学と統計力学を理解しよう」「ゼロから学ぶ統計力学」の説明が丁寧だった。

【7】物理学の本を読んでみて面白いと気づいた点は、複雑な自然現象を単純なモデルとして構築した後、局所的な変化から微分形式を導き、最終的に公式や物理量を導出すること。
単純なモデルと局所的な変化から微分形式、つまり微分方程式を導く箇所は物理屋特有の直観的な考え方がある。
自然現象はこうあるべきだ、という考え方に基づく。
そして、得られた公式や物理量に対し、単なる数式や数値と思わず、物理的にどんな意味を持つのか、を徹底的に考える所が面白い。
そこに物理屋特有の発想がある。

一方、得られた公式や物理量は理論に過ぎず、実験や観測によって最終的には証明される。
理論と実験・観測のアウフヘーベンによって物理学の体系や基礎づけられて強化されるわけだ。
直感と厳密な計算、根気強い実験という相反する能力が要求されている点が面白いと思った。

| | コメント (0)

2024/04/14

物理学の基本思想とは何なのか

最近、物理学の書籍を図書館からかなりの数を借りて読んでみた。
物理初心者の感想をラフなメモ書き。

【参考】
物理学を攻略するためのマップ: プログラマの思索

経済数学の直観的方法の感想: プログラマの思索

数学や物理は背景にある思想を知らなければ理解できない: プログラマの思索

量子革命がコンピュータ革命を引き起こした: プログラマの思索

熱力学や電磁気学の設計思想: プログラマの思索

物理学の設計思想には、いくつかの基本的設計があると思う。

【1】1つ目は、物理学では、数式の意味を解釈することが大切であること。
その数式で、物理的現象や物理量を説明できるか?
ゼロから学ぶ相対性理論」に出てくる。

ローレンツ変換と読むがアインシュタイン方程式と呼ばないのはなぜか?
ローレンツもアインシュタインも同じ数式を導いているが、アインシュタインはエーテルなんて存在せず、速度が絶対速度ではなく2つの座標系の相対速度であることを見抜いた。
ローレンツもアインシュタインも同じ数式であるローレンツ変換を扱っているが、物理的解釈が徹底的に異なる。
そこにアインシュタインの独創性が現れている。

よくわかる電磁気学」の通り、マクスウェルの方程式でも、変位電流に気づいた経緯でも、数式の不整合だけでなく、物理的にも磁場が何らかの電流を放出しているはずだ、という考え方があった。
シュレディンガー方程式は電子が波の性質を持つという考え方があった。

いずれも単なる数式ではなく、数式が物理現象をどのように表現するのか、という観点が必要になってくる。

【2】2つ目は、細かく区切って考えるのが物理学の極意ということ。
よくわかる電磁気学」のあとがきに出てくる。
場の考え方、すなわち近接作用が物理学の基本思想だ。
つまり、近接作用を考えると、物理法則は微分形式で表現できる。
微分積分では、微小な線分、面積、体積をイメージすればいい。

微小なdr, dS, dvなどで物理現象を表現できれば、微分方程式が出てきて、微分方程式を解けば全体的な現象を表す関数や運動方程式が出てくる。
一方、「高校数学でわかるマクスウェル方程式」の通り、マクスウェル方程式は積分形式で表現した方が理解しやすい。
なぜならば、高校数学で出てくるアンペールの法則、電磁誘導の法則などは、マクスウェル方程式の積分形式と対応付けて説明しやすいから。
マクスウェル方程式の微分形式は、「高校数学でわかる相対性理論」の通り、非常に小さな空間で積分形式のマクスウェル方程式を適用すれば出てくる。

近接作用の考え方が場の量子論につながることが「よくわかる電磁気学」でも触れられている。

【3】3つ目は、解析力学を制覇すれば、物理学の諸分野を理解しやすくなるメリットがあること。

たとえば、量子力学、統計力学では解析力学の手法に慣れておくと理解しやすくなる。
よくわかる解析力学」では、最後のあとがきで、相対性理論、量子力学、統計力学に解析力学を適用したときの考え方が説明されている。
一般に、原子や分子レベルでは、古典力学では計算が煩雑になったり、より深く考えにくい。
そこで、解析力学のアプローチを使って、何らかの物理量を最小化したり不変にする前提から運動方程式や保存量を導く。

そこで、相対性理論、量子力学、統計力学に出てくる解析力学のツールが違うならば、それぞれの分野ごとに必要な解析力学のツールを説明した本があれば、解析力学に深入りせずに、本来やりたい分野の勉強に注力できるだろう。
たとえば、量子力学に必要な解析力学のツールだけ理解したいなら、「量子力学を学ぶための解析力学入門 増補第2版」が良いらしい。
ただし、実際に読んでみたら完全に専門書なので、ある程度解析力学の知識がある前提で読み進む必要があると感じた。

ここで、物理学では不変量が大切になる。
不変量は何らかの意味ある物理量を表す。
エネルギー保存則、運動量保存則もそうだ。
だから、物理学ではラグランジアンよりもハミルトニアンが重視されるのではないかと思う。

経済数学の直観的方法 マクロ経済学編」では、経済学の目的は「リソースを最適化する(経済政策や戦略により全体費用を最小化する)」ことにあるのでラグランジアンを多用する。
一方、物理学の目的は「物理量を一定に保つ運動や保存則を見つける」ことなのでハミルトニアンを多用する、と説明があったが、まさにその通りと思う。

解析力学では、物理量を最小にするのがラグランジアン、物理量を不変にするのがハミルトニアンと考える。
しかし、解析力学は難しいと感じる。
解析力学が難しい理由は2つあると思う。
1つは、ラグランジアンやハミルトニアンが導出する方程式や数式の物理的意味を理解しづらいこと。
L=T-U、H=T+Uにはこういう物理的意味があるとどの本でも詳しく説明してくれるが、どうしても天下り的な説明になりがちで、初心者は納得しづらい。

最小作用の原理はどこからくるか? - 物理Tipsにも書いているように、「最小になるようなもんを探したらこれになる」と結局理解するしかないと思う。

もう1つは、たとえば、説明をオイラー・ラグランジュ方程式のように、座標をq、1次微分をqドットのように表現しているので、数式そのものが扱いづらいこと。
オイラー・ラグランジュ方程式は3次元座標x,y,zの微分方程式だから、本来は3つの方程式を書き出さないといけない。
しかし、似たような形の微分方程式を3回書き下すのは面倒だから、頭の偉い人が、x,y,zはq1,q2,q3で書いてしまって、まとめてqにしてしまいましょう、と考えた、とみなせばいい。
そんな説明が「ゼロから学ぶ解析力学」に書かれていて納得した。

個人的には、「ゼロから学ぶ解析力学」が解析力学の取っ掛かりの理解に役立った。
理由は、解析力学のラグランジアンやハミルトニアンがきれいに書かれた公式になる以前に、泥臭い数式や計算を見せて説明してくれているから。

たとえば、「ゼロから学ぶ解析力学」では、最後のあとがきに、ゼロから学ぶという条件のもとにレギュレーション(執筆ルール)を筆者に課した。
一般座標q_iを書かずに普通の座標x,y,zで書ける所まで微分方程式や計算をすべて書いたり、「∂L/∂θドット」とは書かずに「∂L/∂v_θ」と書くなどしている。

実際、オイラー・ラグランジュ方程式も、一般座標qや∂L/∂qドットではなく、3次元座標x,y,zと∂L/∂v_x,∂L/∂v_y,∂L/∂v_zで3つの方程式をすべて書き出してくれている。
それら3つの方程式は略記号により、1つの方程式で最終的にはきれいに書かれるわけなので、こういう泥臭い理解が最初は必要なのだろうと思う。

【4】物理学で理解した内容はまとめておこうと思う。

| | コメント (0)

2024/02/12

アーキテクチャ量子の考え方はソフトウェア工学に物理学アプローチを適用したアイデアではないか

進化的アーキテクチャ」の本を読み直していたら、アーキテクチャ量子の考え方はソフトウェア工学に物理学アプローチを適用したアイデアではないかと気づいた。
ラフなメモ書き。

【1】以前に「進化的アーキテクチャ」の本を読んでいたが、その時はこの本の中身がさっぱり分からなかった。
マイクロサービス設計をコンポーネント分割、モジュール分割のように組み立てたい意図は分かるが、その設計方法や中身が雲のように意味不明だった。

そして、とある勉強会で「ソフトウェアアーキテクチャ・ハードパーツ ―分散アーキテクチャのためのトレードオフ分析」を輪読していた。
この本はマイクロサービス設計の解説なのだが、その中に、アーキテクチャ量子、適応度関数という考え方が出てくる。

アーキテクチャ量子は、これ以上分割できないソフトウェアコンポーネント、みたいなイメージを持っている。
適応度関数は、アーキテクチャを診断するメトリクス、みたいなイメージを持っている。
しかし、ふわふわした抽象的概念であり、すぐに理解しづらい。

なぜ、アーキテクチャ量子、適応度関数のような概念がマイクロサービス設計で必要なのか?

【2】アーキテクチャ量子とは、高度な機能的凝集を持つ独立してデプロイ可能なコンポーネントと定義されている。
なぜ、わざわざ量子みたいな言葉を使う必要があるのか?

進化的アーキテクチャ」では、量子力学のアプローチを使って、モジュール性を説明しようとしている。
物理学では、自然界には4つの力、強い力、弱い力、電磁気力、重力がある。
この概念を流用して、アーキテクチャ量子の言葉の意図は、原子核のような小さな量子では、物理学が言う強い力が働いてバラすことができないこと、つまり、ソフトウェアのコードは組み立て部品のように再利用できる単位に分解できないことを意味しているのだろう。

すなわち、アーキテクチャ量子は再利用可能なソフトウェアコンポーネント、ソフトウェアモジュールの比喩として使っている。

なぜ、わざわざアーキテクチャ量子という新しい言葉を使う必要があるのか?

マイクロサービスはソフトウェアアーキテクチャも含めたレベルでソフトウェアの再利用を目指そうとしている。
つまり、アーキテクチャ量子の考え方を使って、従来からのソフトウェア工学の根本問題、ソフトウェアを再利用できる単位にどのように再構築するか、を考えようとしているのだろう。

アーキテクチャとは、ソフトウェアの中で最も不変な部分に相当するが、ソフトウェアの歴史ではアーキテクチャの範囲がどんどん変わってきている。
再利用の単位が、構造化プログラミング、オブジェクト指向、そしてマイクロサービスへ変遷してきている。
そういう歴史的経緯を踏まえて、アーキテクチャ量子という言葉を新たに用いて、現代風に理解しようとしているのだろう。

【3】アーキテクチャ量子に加えて、適応度関数とは、アーキテクチャが継続的に変化あるいは進化することでどれだけ目的の達成に近づいているか、を計算するための目的関数と定義されている。
なぜ、メトリクスと言わずに、わざわざ適応度関数のような言葉を使うのか?

物理学のアプローチでは、自然界の現象だけでなく、経済や人間の事象に対しても、数式で表現できるはずだ、という設計思想がずっとある。
アーキテクチャ量子のように、ソフトウェアコンポーネントに物理的アプローチを用いたならば、同様に再利用できる単位は何らかの数式で表現できるはずだろう。

その時に、アーキテクチャ量子の診断結果を計測するメトリクスを適応度関数と呼んでいるのではないだろうか。

進化的アーキテクチャ」では適応関数の事例がなくて、抽象的な説明ばかりでイメージづらいが、「ソフトウェアアーキテクチャメトリクス ―アーキテクチャ品質を改善する10のアドバイス」では、適応度関数の具体例が掲載されていて、それでようやく理解できた。

適応度関数は、ユニットテストレベルならばカバレッジや静的コード解析が目標範囲内にあるか評価することに相当するし、統合テストレベルならば、パフォーマンスの計測やAPIテストで目標範囲内にあるか評価することに相当する。
E2Eテストレベルならば、UATで使われる正常業務パターンのスモークテストケース、ビジネス要件やマーケティング要件を評価するメトリクスがあるだろう。

つまり、適応度関数はアーキテクチャが正常であるかを診断するメトリクスとして用いられる。

留意点は、適応度関数はケースバイケースとして色々実現されることだろう。
適応度関数は唯一の正解はなく、システムのアーキテクチャごとに設計されて実装される。
だから、GQMのように、メトリクスが使われる目的や意図が重要になってくる。

【4】アーキテクチャ量子に加えて、適応度関数のような概念を新規に作り出した意図には、物理学アプローチを用いて、マイクロサービス設計のような現代風アーキテクチャを理論化して整理したいことがあるのだろう。

再利用できる単位は、構造化プログラミングでは関数レベルだが、オブジェクト指向プログラミングでは、データと処理がカプセル化されたクラスレベルになった。
今では、マイクロサービスでは、処理を行うサービスとデータを保持するデータベースを一体化したドメインレベルで再利用しようとしている。
つまり、新しい酒は新しい革袋に入れるように、マイクロサービス設計には新しい概念を使うべき、という主張なのだろう。

すなわち、ソフトウェア工学に物理的アプローチを適用したい意図があり、それの一つの例が、アーキテクチャ量子や適応度関数になるのだろう。

そんなことを考えると、「進化的アーキテクチャ」「ソフトウェアアーキテクチャ・ハードパーツ ―分散アーキテクチャのためのトレードオフ分析」の著者は、量子力学などに詳しい物理学の専門家をバックグラウンドに持つソフトウェアアーキテクトなのだろうと推測する。

【5】物理学的なアプローチを自然科学のような自然現象だけでなく、経済現象やソフトウェア工学に適用しようという事例は20世紀後半からよく見られる。
物理学で量子力学や相対性理論が完成した後、物理学が解決すべき問題はかなりなくなってきたという話は昔から聞いていた。
だから、成功の歴史がある物理学のアプローチを使って、自然現象以外の問題に適用して、仕組みをモデル化し、問題を解決しようとする方向性はよく見られる。

たとえば、とある勉強会で、トランスフォーマーのニューラルネットワークの背後に重力の対称性である一般座標変換対称性があると言う話を聞いた。

Xユーザーのakipiiさん: 「トランスフォーマーのニューラルネットワークの背後に重力の対称性である一般座標変換対称性があると言う話を勉強会で聞いた。NNを物理で理解するのは面白いな。Unification of Symmetries Inside Neural Networks: Transformer, Feedforward and Neural ODE https://t.co/ooUEm9bLk1」 / X

この論文では、ニューラルネットワークの背後にゲージ対称性のような仕組みがあるのではと議論しているらしい。
この議論の中で、ある人が話されていた発言がすごく心に刺さった。

「人間が作り出したニューラルネットワークは人間が理解不能な状況になっている。
ニューラルネットワークで起きている座標的なもの、力学的なものを自然界に適用した物理学を使って、ニューラルネットワークの中を研究対象できるのではないか、と思える。
物理学者はこういうものが好き。物理学者は数学を作り出す。」

「ブラック・ショールズ方程式も物理学者が見つけた経済モデル。
自然ではないものに物理学的な思想、物理学的アプローチを適用したものだった。」

今のニューラルネットワークや大規模言語モデルでは、その原理や仕組みはまだ誰も分かっていないまま、Pythonで作られたNNやLLMのライブラリをいかに使って問題解決していくか、みたいなところに走っている気がして、違和感をずっと感じていた。
でも、今までの物理学の知見を使って、NNやLLMの原理を理解しようとする発想は面白いなと思う。

たとえば、経済現象でも、ブラック・ショールズ方程式のような経済学の理論も物理学者がブラウン運動の考え方を使っている。
このブラック・ショールズ方程式により、株式証券の無リスク・ポートフォリオが計算されて、現代の金融取引が成り立っているわけだ。

このように、今までに成功した歴史があり、たくさんの道具やツールが揃っている物理の手法を使うことで、経済現象やニューラルネットワークの仕組みを理解しようとしている。
物理学では現象を数式で説明するので、コンピュータに乗りやすいし、応用がききやすい。

その一連の流れに、ソフト工学に物理的アプローチを適用してみよう、という発想もあろうのだろう、と思っている。
そして、その物理的アプローチはわりと成功する可能性が高いのでは、と思ったりしている。

| | コメント (0)

2023/08/05

熱力学や電磁気学の設計思想

熱力学や電磁気学の説明が直観的で理解しやすい。
カルノーサイクルこそが蒸気機関の本質だがその根本原則はボイルシャルルの法則にある。ここから、熱エネルギーを加えればピストン運動が生まれ、その後内燃機関、発電所までつながる。
電磁気学が難しいのは、電場、電流、電圧、電荷などの沢山の似た用語が出てくること。この辺りの説明が整理されていて大変良かった。
クーロン力の考え方は力学に似てるので、物理の得意な人は電磁気学を力学っぽく解く、と言う指摘はヒントになった。
やはり物理の全ての基礎は古典力学にある。

原子核の軌道に電子が回ってるが古典力学の考え方では原子核に引き寄せられてしまう。しかし現実はそうではない。だから、電子の軌道ははっきり見えるわけではなく、雲のように曖昧で、確率的に求めざるを得ない。ここから量子力学が生まれる。

「物理学の野望」の本が分かりやすかった: プログラマの思索

物理学は一つの認識論: プログラマの思索

物理学を攻略するためのマップ: プログラマの思索

数学や物理は背景にある思想を知らなければ理解できない: プログラマの思索


| | コメント (0)

エネルギー革命が歴史を変えた

人間社会の発展はエネルギー革命にある。
産業革命が生まれるまで、人間は森林資源を浪費して、燃やしたり、建築したりして地球環境を悪化させてきた。
産業革命により、熱エネルギーを運動エネルギーに変換する蒸気機関を生み出して、爆発的にエネルギーを得ることができた。
そのおかげで、空気から窒素を取り出し化学肥料を無尽蔵に作り出し、トウモロコシと言う機械化した炭水化物を無尽蔵に生産させて、牛肉や卵を膨大に作り出すことができた。現代人が手軽に卵や牛肉、牛乳を使い捨てのように食べれるのは全てはエネルギー革命のおかげ。
しかし石炭石油による化石エネルギーの増大は気候温暖化をもたらし地球環境をさらに悪化させた。
現代は、太陽光、風力、地熱などの場所に依存した発電エネルギーに頼ろうとしていて、日本には特に不利。
今後の可能性は核融合による発電だが、これは地球に太陽のような仕掛けを作ろうとしてるので、まだまだ実用化には程遠い、と言ったところか。

「小水力発電が地域を救う」の感想: プログラマの思索

「物理学の野望」の本が分かりやすかった: プログラマの思索

| | コメント (0)

2023/05/28

統計学の考え方をastahでまとめた

統計学の考え方を自分なりにastahでまとめた。
初心者のラフなメモ書き。

【参考】
計量経済学における統計上の根本問題: プログラマの思索

「推計学のすすめ」「経済数学の直観的方法~確率統計編」の感想: プログラマの思索

データ分析の課題はどこにあるのか: プログラマの思索

データ分析の面白さはどこにあるのか: プログラマの思索

経済学や心理学の実験で得られた理論は再現性があるのか?~内的妥当性と外的妥当性の問題点がある: プログラマの思索

経済学は信頼性革命や構造推定により大きく変貌している: プログラマの思索

統計学の考え方に関する感想: プログラマの思索

ランダム化比較試験はなぜ注目されて利用されるようになったのか: プログラマの思索

【1】統計学はいつも習得したいと思うのに、習得にすごく時間がかかる気がするのはなぜだろうか?
その理由は、統計学の考え方は独特な世界観があるからではないかと思う。

なぜ正規分布がそんなに重要なのか?
なぜならば、世界の物事のばらつきは最終的に正規分布に収まるから。
だから、観測や測定でデータを採取したら、まず正規分布を書いて、測定値がどこにプロットされるかイメージたらいい。

最小二乗法の基本思想は何か?
観測や調査で得られた測定値の誤差は正規分布に従う。
ゆえに、測定値のデータの背後にある正規分布の中心線を予測すること。
ガウスが誤差論から生み出した。

統計的仮説検定とは結局何なのか?
そのロジックは確率的な背理法。
だから、ややこしく感じる。

従来の数学や物理の理論や哲学と、昨今のビッグデータやAIなどの違いは何なのか?
従来の理論は演繹的にトップダウンで、世界を説明しようとする。
一方、昨今では、統計理論と強力なコンピューティングパワーで、ビジネスの副産物で得られた大量データを元に因果関係まで帰納的に推測してしまう。

【2】推測統計学の考え方

母集団のデータを全て調査できればよいが、実際はその中の一部のサンプルしか集められない場合が多い。
調査には時間もコストも掛かるから。

では、集めた測定値から母集団はどのような構造になるのか?
大数の定理より、サンプルから推測される母集団の背後にある正規分布を予測する。
そのためにt検定など色んなツールがある。

サンプルデータの抽出方法が上手くないと母集団のデータ構造を推測しにくい。
複数の標本を独立に選ぶことが大事。
つまり、マーケティングのセグメンテーションと同じ考え方。

母集団の平均・分散を既に知っているか、全く知らないか、で推測方法が変わってくる
母集団の平均・分散を既に知っていれば、推測する正規分布の精度は高くなるだろう。
しかし、一般には母集団の平均・分散は全く知らない場合が多いので、推測してもその分誤差は出る。

母集団が1個なのか、2つなのか、で推測方法が変わってくる。
母集団が1つなら、母集団の構造を知ることが重要。
測定したサンプルは母集団のどこにプロットされるのか、が重要なテーマになるだろう。
つまり、内的妥当性の問題になるだろう。

一方、母集団が2つなら、2つの母集団を比べて、優劣や評価を比較することになるだろう。
たとえば、補助金を与えた集団と、補助金なしの集団ではどんな行動の差があるのか、とか。
すると、その行動の差から得られた知見は、その他の母集団に適用できるか、という問題に発展するだろう。
たとえば、米国で得られた統計結果は、日本でも当てはまるのか?とか。
つまり、外的妥当性の問題になるだろう。

【3】正規分布ファミリーの全体像

正規分布には色んな種類がある。
Z分布、t分布、F分布、χ2乗分布とか。

これらの分布は、母集団の平均値や標準偏差を知っているかどうかで変わってくる。

【4】統計的仮説検定の9パターン

統計的仮説検定が理解しにくいと思う理由は、2つあると思う。
1つは、仮説的統計検定の基本思想が確率的背理法であること。
背理法の考え方でつまずきやすいのではないか。

もう一つは、推測したい母集団の平均値や標準偏差が既知なのか未知なのか、で手法が変わってくること。
たくさんの検定手法があって名前から手法の中身を推測しにくい。
前提条件をIF文で分岐処理して検定手法が確定するので、そのパターンをイメージしておかないといけない。

【5】統計検定2級は6年前に取得した。
その時に上記の考え方を自分のastahの中で色々書き込んでいた。
その時のメモを残しておいた。

これらをベースに機械学習がある。
分類(classification)、回帰(regression)、クラスタリング(clustering)、次元圧縮(dimensionality reduction)とか。
PythonのScikit-Learn のチートシートも公開されているので、またまとめておく。

Pandas Cheat Sheetのリンク: プログラマの思索

scikit-learn「アルゴリズム・チートシート」のリンク: プログラマの思索

| | コメント (0)

2022/09/12

「物理学の野望」の本が分かりやすかった

物理学の野望 「万物の理論」を探し求めて」の本が分かりやすかった。
物理学は、世界のすべての現象を1つだけの考え方で統一して説明しようと頑張っている。

【参考】
物理学は一つの認識論: プログラマの思索

物理学を攻略するためのマップ: プログラマの思索

「小水力発電が地域を救う」の感想: プログラマの思索

その発想の原点は、オッカムの剃刀にある。

ウィリアム=オブ=オッカム

(引用開始)
ウィリアム=オブ=オッカムが云った言葉に「存在は必要以上に増やされるべきではない」というのがある。これは、真理は単純明快なものであり、それを説明するのに余計なことはできるだけ省くべきであるという意味で、「オッカムの剃刀(カミソリ)」と云われている。
この言葉は、一般にある問題についていくつかの解答があった場合、「より少ない原理でより多くの現象を説明できる理論の方がよりよい」ということで、例えば天動説と地動説では、天動説では天体の運動と地上の物体の運動とで別々の法則を立てなければならないが、地動説は両者を一つの運動法則で説明できるから、こちらの方が正しい、と言うように使われる。
(引用終了)

数多くの現象を集めても無意味で、それら現象をより少ない原理で説明されるべき。

物理学の野望 「万物の理論」を探し求めて」ではこんなストーリーになる。

まず、ニュートン力学により、地球の外にある天上の世界を1つの原理で説明した。
次に、物理学者たちは、地上の現象を説明しようと頑張った。
彼らが取り組んだのは、熱、光、電磁気。
熱はエネルギーの一つの要素と分かり、光は電磁波と分かり、電気と磁気は相対する関係と分かった。
そして、マクスウェルの方程式でそれらの現象は統一して説明できるようになった。

そして、電磁気力、弱い力、強い力は最終的に法則で統一された。
最後に残るのは、重力。

物理学の野望 「万物の理論」を探し求めて」には書かれていないが、おそらく超弦理論が4つの全ての力を統一する法則を提供するのだろう。

物理学の野望 「万物の理論」を探し求めて」で興味深かったのは、発電所は、磁気モーターで電気を作り出す仕組みが根本にあり、そのモーターを回す仕組みを○○力発電と呼んでいるだけ、ということ。
たとえば、水力発電、風力発電、火力発電、地熱発電、原子力発電は、磁気モーターをどの力で動かしているか、という違いを表しているに過ぎない、と。
なるほど、たしかにそう考えると当たり前なのだろうが、詳しくないので新鮮だった。


| | コメント (0)

2022/04/18

物理学を攻略するためのマップ

物理学を攻略するためのマップを見つけたのでメモ。

初心者向けガイド - 物理 攻略 Wiki

物理学は一つの認識論: プログラマの思索

数学や物理は背景にある思想を知らなければ理解できない: プログラマの思索

『ものづくりの数学』の感想 #もの数: プログラマの思索

理系脳かどうかの分かれ道は、物理学が好きかどうか、物理学を習得できているかどうか、だと思う。
なぜならば、いくら数学ができたとしても、その数学テクニックを実際の自然科学の場で使えなければ意味がないからだ。
化学や生物学などの根底には物理学の理論があるので、最終的には物理学がわかっている必要がある。
物理を習得できれば、小難しい数学の理論を実際にどのように使っているのか、理解しやすい。

たとえば、微積分なら微分方程式を使いこなすことだろうし、微分方程式を使いこなせれば、古典力学の現象をほぼすべて表現できる。
解析力学がその最終到達点になるだろう。
たとえば、線形代数やベクトルは、電磁気学、相対性理論、量子力学などで実際に使えば分かる。

しかし、高校物理では微分方程式を扱えないので、古典力学や電磁気学などでは、やたらと公式を覚えざるを得なくなる。
だから、高校物理の受験問題にフィットしすぎると、本来の物理が理解しにくくなると思う。

その現象はちょうど、私立中学受験で鶴亀算のテクニックを極めすぎて、連立方程式や線形代数の理解を妨げるのと同じだ。

また、理論物理学の範囲は非常に広く、さらに奥深いので、なかなか習得しにくい。
量子力学を習得する前に解析力学も必要になるように、前段の理論や知識を習得しておかないと前に進めない。

そんな時に、物理学を攻略するためのマップを見つけて、こういうマップを事前に知っておけば良かったと思った。
なぜならば、物理学を制覇するためにはどんなルートを通る必要があって、どれくらいの難易度があるのか、を物理攻略マップからある程度概観できるからだ。

僕個人の考えでは、理論物理学を習得したいならば、量子力学と相対性理論はマスターする必要があると思う。
換言すれば、量子力学と相対性理論という2代巨峰を習得できれば、その他の物理の専門分野は理解しやすいだろう。
ちょうど、量子力学と相対性理論という2代巨峰から、その他の山々を見下ろす感じみたいに。

| | コメント (0)

2021/08/07

様々な確率分布は正規分布のバリエーションに過ぎない

経済数学の直観的方法 確率・統計編 (ブルーバックス) | 長沼 伸一郎 |本 | 通販 | Amazon」で、様々な確率分布は正規分布のバリエーションに過ぎない、という言葉で気づいたのでメモ。
以下はラフなメモ。

【参考】
17-3. 中心極限定理1 | 統計学の時間 | 統計WEB

 「経済数学の直観的方法 確率・統計編」のあとがきに代えて

「推計学のすすめ」「経済数学の直観的方法~確率統計編」の感想: プログラマの思索

統計学の考え方に関する感想: プログラマの思索

経済学は信頼性革命や構造推定により大きく変貌している: プログラマの思索

中心極限定理により、全ての確率分布を集めると正規分布に一致する。
逆に言えば、正規分布からあらゆる確率分布を導き出せる。

正規分布を有限回数の離散分布にすれば、二項分布になる。
1回あたり1万分の1ぐらいの確率分布を数年に渡って眺める場合、正規分布を1回毎の確率と時間を大きくスケール変換すればポアソン分布。

正規分布から、一定のバイアス部分、つまりトレンドだけを抽出すれば、ベキ分布。

正規分布の母集団から、少ないサンプル数で標本を取り出し、平均値を推測するのがt分布。
正規分布の母集団から、複数の標本を取り出し、複数の標本の不偏分散のバラツキを見たのがF分布。
正規分布の母集団から、任意の標本を取り出し、その不偏分散のバラツキを見たのがカイ二乗分布。

こういう理解を元にすれば、目の前にあるデータから、本来の母集団のデータ構造を推測するにはどのように考えたらよいか、を少しは考えやすくなると思った。

| | コメント (0)

2020/10/07

経済学は信頼性革命や構造推定により大きく変貌している

最近、図書館から借りている「経済セミナー」という雑誌が非常に面白い。
経済学は信頼性革命や構造推定により大きく変貌している。
10月号では、「変貌する経済学:実証革命が導く未来」の特集号が非常に面白くてためになった。
気づきをラフにメモ。

実証革命?経済学が会計学に影響を与えるもの|上野 雄史|note

「予想よりも早かった」ノーベル経済学賞(會田 剛史) - アジア経済研究所

伊藤先生は、「データ分析の力 因果関係に迫る思考法」の本でも知っていた。
伊藤先生いわく、日本の高校生が踏み絵を踏まされる「文理選択」は廃止すべきだ、と言う。
高校生の頃、数学が好きだったが、化学や生物は興味が持てず、むしろ社会科学に興味があった。
だから、文理のどちらに行くか悩んだ、という言葉は共感する。
僕も、数学は好きだったし、日本史や世界史や地理はとても好きだったが、物理や化学は正直好きになれなかった。
結局理系に進んだけれど、今でも、歴史の本は好きだからよく借りている。
数学と社会科学の興味の両方を活かせるのが経済学。

経済学は信頼性革命や構造推定により大きく変貌している。
特集記事で曰く。
現代の経済学は、ルーカス批判、信頼性革命、構造推定の3つによって、実証革命が起こり、経済学が公共政策やビジネスに非常に役立つようになった。

僕の理解では、ルーカス批判は、モデルは説明変数とその変数の変化率の2つで考えるべきだ、というもの。
「経済数学の直観的方法 マクロ経済学編 」にも書いてあった。
信頼性革命は、ランダム比較実験で意思決定の結果の良否を説明付けられる、ということかな。
構造推定は、モデルにおける2つの変数の因果関係を明確に説明付ける、ということかな。

相関関係と因果関係は全く違う。
相関関係は、2つの変数に何らかの関係がある事実しかない。
因果関係は、要因→結果という一方向のロジックまで特定する。
このレベルまで経済学が理論付けられるとしたら、すごいことだ。

伊藤先生は学生指導で、既存研究の仮定を疑って検証する発想を持て、とよく言うらしい。
そう、この発想は、自然科学でも文系の学問でも同じだな、と思う。

伊藤先生の博士論文では、消費者が実際に見ているのは限界価格なのか、平均価格なのかを電力市場のデータで検証したらしい。
これはまさに、電力会社のように固定費が高く寡占市場になりやすい市場において、社会厚生を最大にするには、平均費用価格なのか、限界費用価格なのか、という政策論争につながる。

伊藤先生の研究スタイルは、まずは社会にとって自分にとっても大きな問いを立てて、その問題が経済理論でどのように整理できて、どんなデータ分析手法で検証できるか、を考えていく。
この話を読んで、研究者として王道のスタイルだなあ、と思った。
偉大な学者は、とてもシンプルかつ根源的な問題を持っていて、その問題を解くために、色んな方向性から考えたり、レベルを落としたり、寄り道したりして、その過程で数多くの研究成果を残すが、常に根本的な問題を持ち続けている。

経済学の面白い点は、IT革命でコンピューティングパワーが強化されて、大量データの収集と膨大な計算が簡単になったことだろう。
つまり、経済現象を分析するツールが揃ってきた点が、最近面白い点になるのだろう。
そういう背景を踏まえて、信頼性革命や構造推定などの考え方が組み合わさって、経済現象を理論化できたり、政府の政策やビジネスの意思決定に役立てる応用もできているのだろう。

実際、補助金や公共投資はどんな政策であれば効果的なのか、とか、どのようなインセンティブを市場に与えると社会全体として経済効果が波及されるのか、など色んな事例に対して、経済学を適用することができる。

個人的には、経済学の発想をソフトウェア工学に適用したら、どんなことができるのだろうか、と妄想している。


| | コメント (0)