超簡単 ! Windows で Mahout IN ACTION (Mahout IN ACTIONの自習その1)
最近結構その手の方々には人気の Mohout 本「Mahout IN ACTION」。
で、結局買ってしまったので、せっかくだから、自習してみようと思います。
そんなに速いペースでは読めないと思うので、取り合えず、1日最低4ページを目処にしてみようかと思います。
- 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman
- 出版社/メーカー: Manning Pubns Co
- 発売日: 2011/10/28
- メディア: ペーパーバック
- 購入: 4人 クリック: 81回
- この商品を含むブログ (10件) を見る
で、今回はabout this bookとChap1 "Meet Apache Mahout"。
Chap1 では、開発環境の作り方が書いてあります。
今回は、Windowsで超簡単に作ってみます。
about this book
この本は誰むけに作った?
主に3つのパートで書いてある
Chap1
Mahoutはヒンズー語で「象使い」。
Hadoopのマスコットは象で、これを使うということ。
Mahoutは数多くの機械学習をテーマにしているが、
主に、recommendation(協調フィルタリング)、クラスタリング、分類の3つの分野を主に使う。
セットアップ
- Java 1.6
- Java IDE (eclipse, NetBeans, IDEA)
- Maven (IDEがあれば、Mavenと統合できる)
- Mahout(頻繁に変わるからSVNから入れるのがよいよ)
- この本のサンプルはhttp://manning.com/owen/
- Hadoop (セットアップは難しくないよ)
というのがこの本の解説。
で、面倒なので、超簡単にしましょう。
WindowsでMahout in action
まず、Hadoopは今回は入れません。
Mahout in action のサンプルにMavenの設定ファイルがあるので、これを使います。
2, Eclipse Indigoを入れる。
3, m2eclipse を Eclipse に入れる。
Help > Install new software...
Addボタンで、以下のURLを入れる。
http://download.eclipse.org/technology/m2e/releases
出てくるプラグインをインストール