オープンソースのレコメンドエンジンMahout
オープンソースのレコメンドエンジンMahoutについてリンクをメモ。
【元ネタ】
Apache Mahout の紹介
InfoQ: Mahout 0.3: オープンソースの機械学習プロジェクト
mahout/レコメンドシステムの作り方 - PukiWiki
レコメンドエンジンは、Amazonのオススメ商品機能が有名だろう。
AmazonがWeb業界でこれだけの影響力がある理由の一つは、レコメンドエンジンを最初にビジネスとして成功させたことがあるかもしれない。
レコメンドエンジンのアルゴリズムは協調フィルタリングが良く使われているだろうと思う。
OSSではApache Mahoutが有名らしい。
Mahoutの詳細は知らないけど、Hadoopと組み合わせて、レコメンドエンジンを高速化することは可能だ。
レコメンドエンジンは日々の大量のトランザクションデータをデータマイニングして、意味ある情報を取り出して、ユーザに価値ある情報を提供して、商品の購買を誘う。
データマイニングは以前はDWHのように特別なDB設計と高価なシステムが必要だったけれど、Hadoopで高速な分散並列処理を実装しやすくなったおかげで、データマイニングを普通のプログラマが実装できるようになってきている。
データマイニングはうまくビジネスに当てはめれば、プログラマにとって協力な武器になる。
マーケティングの知識がなくても、Hadoop+データマイニングで、今までに無かった新たな因果関係を見つけ出すことも可能。
郊外の業務スーパーでは紙おむつとビールが良く売れた、という都市伝説は、まさにデータマイニングなしでは分からなかった因果関係だ。
Web2.0の本質はデータマイニングにあり: プログラマの思索
データを収集して分析するというコンピュータの利用目的は未だに変わらないけれど、その実装方法は以前よりも高度にかつ簡単になりつつある。
その背景のキーワードは分散並列処理。
色々調べてみる。
| 固定リンク
« 抱腹絶倒「スパルタ達によるプログラマ職業紹介」 #aj11 #aj11osaka | トップページ | AgileJapan2011Osakaの感想~Agileのコンテキストが拡散している #aj11osaka #aj11 »
「モデリング」カテゴリの記事
- 「システム開発・刷新のためのデータモデル大全」を読み直した感想~親子頻出アンチパターンは初心者モデラーに多い(2024.08.31)
- 「システムアーキテクチャ構築の原理」の感想part2~非機能要件がシステムのアーキテクチャに影響を与える観点をプロセス化する(2024.05.06)
- 「システムアーキテクチャ構築の原理」の感想(2024.05.06)
- ソフトウェア工学の根本問題から最近のソフトウェア設計を考えてみる(2024.03.03)
- アーキテクチャ量子の考え方はソフトウェア工学に物理学アプローチを適用したアイデアではないか(2024.02.12)
「ソフトウェア」カテゴリの記事
- Javaのモジュールシステムの考え方をまとめてみた(2022.10.21)
- Javaのenum型はシングルトンクラスみたいだ(2022.06.20)
- テスラが従来の自動車メーカーと異なるところは工場までソフトウェア化すること(2022.02.09)
- 「RubyやRailsは終わった」という記事のリンク(2022.01.09)
- 実践した後に勉強するのがエンジニアの本来の道(2022.01.09)
コメント