Carpe Diem

備忘録。https://github.com/jun06t

Hadoop

Hiveの導入

前回Hadoopを導入したので、今回はSQLライクなクエリの使用出来るHiveを導入します。 Hadoopで大規模なデータを扱う場合、Javaを使ってMapReduceプログラムを実装することが本来必要ですが、Hiveを使うとそのコストがなくなりSQLさえ知っていれば利用できる…

Hadoopの導入(CDH3)

分散処理フレームワークとして有名なHadoopを入れてみます。 本来分散処理なので複数の端末を想定すべきですが、擬似分散モードというのがあるためそちらでとりあえず導入して遊んでみようと思います。 ◆事前準備 JDKが必要です。 $ sudo aptitude install o…