Instituto de Computação - UNICAMP

MO809/MC964 - Tópicos em Computação Distribuída

Experimento com o Hadoop MapReduce

Segundo Semestre de 2015

Islene Calciolari Garcia


Objetivo e avaliação

Fazer experimento com aplicação MapReduce que tenha sido tema de artigo científico.

Pontuação: 2.0 (2 pontos equivalem a 20% da média final)

Exemplos:


Ambientação

Instalação do Hadoop

Você deve instalar o Hadoop (não precisa ser a versão com código fonte). Existem três modos: Sugiro o modo Pseudo-Distributed, também chamado de Single Node Cluster. Neste modo, você precisará de apenas um computador e poderá verificar o funcionamento dos componentes do Hadoop (HDFS e YARN).

Principais passos:

MapReduce

WordCount

Você deve rodar o código do WordCount v1.0, seguindo o MapReduce Tutorial

A partir deste passo, você poderá alterar este teste, para implementar o seu próprio código mapreduce. Por exemplo, você pode escrever uma variação que conta as palavras de mesmo tamanho ou as palavras que começam com uma dada letra (veja Developing First MapReduce Job).

Outros exemplos

O pacote Hadoop vem com os seguintes exemplos. Você pode fazer o download do Hadoop com o código fonte ou obter apenas os exemplos aqui.