« 抱腹絶倒「スパルタ達によるプログラマ職業紹介」 #aj11 #aj11osaka | トップページ | AgileJapan2011Osakaの感想~Agileのコンテキストが拡散している #aj11osaka #aj11 »

2011/04/15

オープンソースのレコメンドエンジンMahout

オープンソースのレコメンドエンジンMahoutについてリンクをメモ。

【元ネタ】
Apache Mahout の紹介

InfoQ: Mahout 0.3: オープンソースの機械学習プロジェクト

mahout/レコメンドシステムの作り方 - PukiWiki

レコメンドエンジンは、Amazonのオススメ商品機能が有名だろう。
AmazonがWeb業界でこれだけの影響力がある理由の一つは、レコメンドエンジンを最初にビジネスとして成功させたことがあるかもしれない。

レコメンドエンジンのアルゴリズムは協調フィルタリングが良く使われているだろうと思う。
OSSではApache Mahoutが有名らしい。

Mahoutの詳細は知らないけど、Hadoopと組み合わせて、レコメンドエンジンを高速化することは可能だ。
レコメンドエンジンは日々の大量のトランザクションデータをデータマイニングして、意味ある情報を取り出して、ユーザに価値ある情報を提供して、商品の購買を誘う。

データマイニングは以前はDWHのように特別なDB設計と高価なシステムが必要だったけれど、Hadoopで高速な分散並列処理を実装しやすくなったおかげで、データマイニングを普通のプログラマが実装できるようになってきている。
データマイニングはうまくビジネスに当てはめれば、プログラマにとって協力な武器になる。
マーケティングの知識がなくても、Hadoop+データマイニングで、今までに無かった新たな因果関係を見つけ出すことも可能。
郊外の業務スーパーでは紙おむつとビールが良く売れた、という都市伝説は、まさにデータマイニングなしでは分からなかった因果関係だ。

Web2.0の本質はデータマイニングにあり: プログラマの思索

データを収集して分析するというコンピュータの利用目的は未だに変わらないけれど、その実装方法は以前よりも高度にかつ簡単になりつつある。
その背景のキーワードは分散並列処理。
色々調べてみる。

|

« 抱腹絶倒「スパルタ達によるプログラマ職業紹介」 #aj11 #aj11osaka | トップページ | AgileJapan2011Osakaの感想~Agileのコンテキストが拡散している #aj11osaka #aj11 »

モデリング」カテゴリの記事

ソフトウェア」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: オープンソースのレコメンドエンジンMahout:

« 抱腹絶倒「スパルタ達によるプログラマ職業紹介」 #aj11 #aj11osaka | トップページ | AgileJapan2011Osakaの感想~Agileのコンテキストが拡散している #aj11osaka #aj11 »