Exercício 2

Data de entrega 21/3 em aula

No arquivo zip treino.zip contem uma colecao de imagens PGM de digitos manuscritos. . Cada imagem do conjunto possui 64 x 64 pixels no formato PGM onde cada pixel tem um valor 0 ou 1. Cada imagem tem um nome no formato X_yyy.BMP.inv.pgm onde X é o dígito representado na imagem. ATENCAO - removam o arquivo 0_033.BMP.inv.pgm do treino - esta imagem tem tamanho diferente das outras.

O arquivo teste.zip contem 50 images de digitos no mesmo formato.

oa arquivos PGM comecam com 3 linhas contento P2 64 64 1 que não nos interessa, seguido de 64x64 digitos, separados por um branco ou mudança de linha. Este projeto trata estes 64x64 digitos como os atributos ou dimensões de cada dado. A classe do dado é o digito representado (de 0 a 9) que esta no nome do arquivo.

So para documentacao, alguns alunos me mostraram como fazer a coisa certa com o PCA em R.
n é o numero de dimensoes a manter

pca<- prcomp(treino)
novotreino<-pca$x[,1:n]
novoteste<-scale(teste,pca$center,pca$scale)%*%pca$rotation[,1:n]