Instituto de Computação - UNICAMP

INF550 - Computação em Nuvem I

Experimento com Spark

Curso de Especialização em Redes de Computadores 2016

Islene Calciolari Garcia


Instalação do Spark

Na primeira parte do experimento, você deve instalar o Spark:
  $ wget http://ftp.unicamp.br/pub/apache/spark/spark-1.6.2/spark-1.6.2-bin-hadoop2.6.tgz
  • Descompacte com
      $ tar xzf spark-1.6.2-bin-hadoop2.6.tgz
    
    Utilize o pyspark em:
     $ bin/pyspark
    

    Exercício para entrega:

    Utilizando os arquivos fourhour-tcpdump.list e tcpdump.list fornecidos pela DARPA elabore no mínimo três manipulações/consultas interessantes sobre os dados. Tenha em mente que você está pensando em detectar um ataque.

    Escreva um relatório contendo a motivação, o código das consultas e exemplos do resultado.

    O trabalho pode ser feito em duplas e entregue pelo Moodle.