前処理大全の良いところ~SQLとRとPythonで対比できる
「前処理大全」の感想をラフなメモ書き。自分のための参考記事をリンクしておく。
【参考】前処理大全[データ分析のためのSQL/R/Python実践テクニック]:書籍案内|技術評論社
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 1)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 2)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 3)
Community Blog - 『仕事ではじめる機械学習』&『前処理大全』著者対談(Part 4)
データ分析初心者は「前処理大全」でデータ前処理を学べ | リーマンエンジニアのブログ
前処理大全は機械学習に関わる人の必需品 | Tamanyan.me | たまにゃんのエンジニアブログ
R初心者はこれを見ろ!便利なパッケージまとめ!入門編 - Qiita
「前処理大全」はサラリと読んだだけのレベル。Rで少しずつ書きながら、こんな使い方をするのか、と初心者レベルから理解している。
R言語は以前からやりたい、と思っていたが、なかなか慣れなかった。SQLは分かるので、「前処理大全」のおかげでSQLと比較することで、R言語の書き方を覚えられる。「前処理大全」には、RよりもSQLの方が短く書ける場合もある、という事例が新鮮だった。
dplyrライブラリのおかげで、SQLのようなデータ操作をUnixパイプみたいに書けるのが快適。データ加工をバラし、試行錯誤しながら、データの特徴を分析できるのが楽しい。ggplotも使えば、データ分析結果をいろんなグラフで表示できるのもいい。
「前処理大全」の面白さは、SQLとRとPythonのプログラムを比較できる点にある。SQLのメリット、Rのメリットがどんな利用シーンであるのかよく分かる。
ちょうど、古代に書かれた聖書で、古代ギリシャ語とラテン語、コプト語を対比した書物みたいな感じ。SQLとRで、ニュアンスの微妙な違いが面白い。
但し、「前処理大全」はあくまでも、機械学習やデータ分析の前処理だけに特化しているので、それだけでは十分でないことは分かっている。本当の面白さはその先にあるから。
| 固定リンク
「プログラミング」カテゴリの記事
- Ruby技術者認定試験の感想(2020.05.08)
- 前処理大全の良いところ~SQLとRとPythonで対比できる(2019.07.10)
- WinSCPでトンネリングする方法のリンク(2018.09.09)
- 仕様書にもExcel脱却が求められている(2017.12.23)
- ソフトウェアの複雑性は本質的な性質であって偶有的なものではない(2017.05.05)
「統計学・機械学習・深層学習」カテゴリの記事
- Pythonデータ分析試験、Python基礎エンジニア試験に合格した感想~Pythonの機械学習や深層学習が目指すのは因果推論ではないか(2021.01.11)
- Pythonデータ分析の気づき(2020.12.18)
- Pandas Cheat Sheetのリンク(2020.12.06)
- scikit-learn「アルゴリズム・チートシート」のリンク(2020.12.04)
- アジャイル動画「私もアジャイルに飛びこんだの! -- 『品質重視のアジャイル開発』の誉田さんインタビュー」がいいね(2020.10.31)
コメント