Exercício 2

Data de entrega 25/3 em aula

ATENCAO - Mudanca na parte do PCA - 21/3

No arquivo zip train17.zip contém uma coleção de imagens PGM de dígitos 1 e 7 manuscritos. Cada imagem do conjunto possui 64 x 64 pixels no formato PGM onde cada pixel tem um valor 0 ou 1. Cada imagem tem um nome no formato X_yyy.BMP.inv.pgm onde X é o dígito representado na imagem.

O arquivo test17.zip contem images de teste no mesmo formato.

Os arquivos PGM começam com 3 linhas: P2
64 64
1
que não nos interessam, seguido de 64x64 digitos, separados por um branco ou mudança de linha. Este projeto trata estes 64x64 digitos como os atributos/dimensões de cada dado. A classe do dado é o digito representado (de 0 a 9) que esta no nome do arquivo.

Como usar o PCA no R.
n é o numero de dimensoes a manter

pca<- prcomp(treino)
novotreino<-pca$x[,1:n]
novoteste<-scale(teste,pca$center,pca$scale)%*%pca$rotation[,1:n]
A primeira linha calcula o PCA. A segunda retorna os dados de treino convertidos pelo PCA - voces devem ter feito algo parecido no Exercicio 1. A terceira linha usa o PCA dos dados de treino para converter os dados de teste para as mesmas dimensoes tranformadas do dado de treino