Instituto de Computação - UNICAMP

Curso de Especialização em Redes de Computadores 2018

INF550 - Computação em Nuvem I

Islene Calciolari Garcia

Experimento com OpenStack e MapReduce


Ambiente Cloud.ic

Instanciação de uma máquina virtual

Vamos fazer nosso experimento em uma máquina virtual do ambiente OpenStack fornecido pelo IC. Esta máquina receberá um IPv4 para uso local.

Clicar em Compute (no menu lateral esquerdo), depois em Instances e siga os passos abaixo:

Clicar em Network (no menu lateral esquerdo), depois em Security Groups:

Após a configuração, vamos testar o acesso via ssh com:

$ ssh -i cloud.key fedora@<ip da instância>

Uso Hadoop: HDFS + MapReduce

A partir daqui, você deve estar logado na máquina virtual:

[fedora@hadoop-fedora ~]$

Antes de iniciarmos os daemons faça verificação da presença do arquivos abaixo. Pode acontecer de o login ser efetuado antes da configuração acabar.

[fedora@fedora2 ~]$ ls
hadoop-2.8.4 wc-python
[fedora@fedora2 ~]$ ls wc-python/
mapper.py  reducer.py
[fedora@fedora2 ~]$ ls .ssh
authorized_keys  id_rsa  id_rsa.pub  known_hosts    

Para este experimento, utilizaremos a versão 2.8.4 do Hadoop. Existem versões mais novas com funcionalidade adicionais, mas são mais instáveis. O experimento consiste em uma parte fixa, em que você seguirá uma sequência bem definida de passos para executar a versão MapReduce do grep. Em seguida, você deverá propor e executar um pequeno teste.

Hadoop: modos de operação:

Existem três modos para teste e instalação do Hadoop:

A máquina virtual está préconfigura para usar o modo Pseudo-Distributed, também chamado de Single Node Cluster. Neste modo, você precisará de apenas um computador e poderá verificar o funcionamento dos componentes do básicos Hadoop (HDFS e MapReduce).

Escrevendo seu próprio MapReduce

Para adaptar o código você pode, por exemplo:

Se você gosta de JAVA...

Execute o código do WordCount v1.0, seguindo o MapReduce Tutorial.

Entrega do relatório

O experimento pode ser feito em duplas; apenas uma pessoa precisa entregá-lo via Moodle. Em caso de fraude, poderá ser atribuída nota zero à disciplina.

Data final para entrega: 07 de julho