オープンソースのレコメンドエンジンMahout
オープンソースのレコメンドエンジンMahoutについてリンクをメモ。
【元ネタ】
Apache Mahout の紹介
InfoQ: Mahout 0.3: オープンソースの機械学習プロジェクト
mahout/レコメンドシステムの作り方 - PukiWiki
レコメンドエンジンは、Amazonのオススメ商品機能が有名だろう。
AmazonがWeb業界でこれだけの影響力がある理由の一つは、レコメンドエンジンを最初にビジネスとして成功させたことがあるかもしれない。
レコメンドエンジンのアルゴリズムは協調フィルタリングが良く使われているだろうと思う。
OSSではApache Mahoutが有名らしい。
Mahoutの詳細は知らないけど、Hadoopと組み合わせて、レコメンドエンジンを高速化することは可能だ。
レコメンドエンジンは日々の大量のトランザクションデータをデータマイニングして、意味ある情報を取り出して、ユーザに価値ある情報を提供して、商品の購買を誘う。
データマイニングは以前はDWHのように特別なDB設計と高価なシステムが必要だったけれど、Hadoopで高速な分散並列処理を実装しやすくなったおかげで、データマイニングを普通のプログラマが実装できるようになってきている。
データマイニングはうまくビジネスに当てはめれば、プログラマにとって協力な武器になる。
マーケティングの知識がなくても、Hadoop+データマイニングで、今までに無かった新たな因果関係を見つけ出すことも可能。
郊外の業務スーパーでは紙おむつとビールが良く売れた、という都市伝説は、まさにデータマイニングなしでは分からなかった因果関係だ。
Web2.0の本質はデータマイニングにあり: プログラマの思索
データを収集して分析するというコンピュータの利用目的は未だに変わらないけれど、その実装方法は以前よりも高度にかつ簡単になりつつある。
その背景のキーワードは分散並列処理。
色々調べてみる。
| 固定リンク
« 抱腹絶倒「スパルタ達によるプログラマ職業紹介」 #aj11 #aj11osaka | トップページ | AgileJapan2011Osakaの感想~Agileのコンテキストが拡散している #aj11osaka #aj11 »
「モデリング」カテゴリの記事
- 自動車の組込ソフトウェア開発が難しい理由は3つある(2026.02.23)
- データモデリングではシステムが宿命的に負う複雑性をどのように解決しようとしているのか(2026.02.14)
- データモデリングの手法をあなたは持ってますか? at 関西IT勉強宴会(2026.02.11)
- 製造業のDXを推進する部門をITコーポレート部門に割り当てるとなぜ失敗するのか(2026.02.04)
- プ譜でプロジェクトの目的を管理する(2026.01.31)
「ソフトウェア」カテゴリの記事
- Redmine AI HelperプラグインはRedmineをAI駆動プロジェクト管理に変える可能性を秘めている #Redmine(2025.12.31)
- 「RedmineのUbuntu+Docker構築への移行」の感想 #redmineT(2024.11.24)
- Javaのモジュールシステムの考え方をまとめてみた(2022.10.21)
- Javaのenum型はシングルトンクラスみたいだ(2022.06.20)
- テスラが従来の自動車メーカーと異なるところは工場までソフトウェア化すること(2022.02.09)


コメント