前処理大全の良いところ~SQLとRとPythonで対比できる
「前処理大全」の感想をラフなメモ書き。自分のための参考記事をリンクしておく。
【参考】前処理大全[データ分析のためのSQL/R/Python実践テクニック]:書籍案内|技術評論社
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 1)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 2)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 3)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 4)
データ分析初心者は「前処理大全」でデータ前処理を学べ | リーマンエンジニアのブログ
前処理大全は機械学習に関わる人の必需品 | Tamanyan.me | たまにゃんのエンジニアブログ
R初心者はこれを見ろ!便利なパッケージまとめ!入門編 - Qiita
「前処理大全」はサラリと読んだだけのレベル。Rで少しずつ書きながら、こんな使い方をするのか、と初心者レベルから理解している。
R言語は以前からやりたい、と思っていたが、なかなか慣れなかった。SQLは分かるので、「前処理大全」のおかげでSQLと比較することで、R言語の書き方を覚えられる。「前処理大全」には、RよりもSQLの方が短く書ける場合もある、という事例が新鮮だった。
dplyrライブラリのおかげで、SQLのようなデータ操作をUnixパイプみたいに書けるのが快適。データ加工をバラし、試行錯誤しながら、データの特徴を分析できるのが楽しい。ggplotも使えば、データ分析結果をいろんなグラフで表示できるのもいい。
「前処理大全」の面白さは、SQLとRとPythonのプログラムを比較できる点にある。SQLのメリット、Rのメリットがどんな利用シーンであるのかよく分かる。
ちょうど、古代に書かれた聖書で、古代ギリシャ語とラテン語、コプト語を対比した書物みたいな感じ。SQLとRで、ニュアンスの微妙な違いが面白い。
但し、「前処理大全」はあくまでも、機械学習やデータ分析の前処理だけに特化しているので、それだけでは十分でないことは分かっている。本当の面白さはその先にあるから。
| 固定リンク
「プログラミング」カテゴリの記事
- Javaのモジュールシステムの考え方をまとめてみた(2022.10.21)
- Javaのモジュールシステムは複雑性をより増している(2022.09.10)
- Javaはなぜ関数型言語になろうとしているのか(2022.09.02)
- Javaのラムダ式の考え方(2022.08.10)
- Javaはオブジェクト指向言語ではなく関数型言語だった~「[増補改訂]関数プログラミング実践入門」はお勧めの本だ(2022.08.06)
「統計学・機械学習・深層学習」カテゴリの記事
- Unifiedメモリとは何か?(2026.05.24)
- 夢のオンプレLLM環境? NVIDIA DGX Sparkの真実と「Claude Code代替」の壁(2026.05.24)
- ディープラーニングではなぜ微分が重要なのか?(2026.05.09)
- 「資料をそのままAIに食わせたい」を解決するMicrosoft製ツールMarkItDownとは?(2026.04.25)
- なぜ『図解 線形代数: ストラング流直感的理解』は分かりやすいのか?従来の線形代数との決定的な違い(2026.04.25)


コメント