Exercício 5

Data de entrega 21/5 em aula

Use os dados aqui para o projeto de clusterização.

Faça um agrupamento usando k-means, com k=2 ate k=7.

Para estes valores de k

Usando o indice de Dunn e a variancia intracluster, qual o valor ou os valores corretos para o k? Ele concorda com a sua intuição vendo os plots?

Para algum k bom, plote a clusterização para 3 inicializações do k-means diferentes. O que isso te diz sobre a estabilidade dos clusters?

Use uma aglomeração hierarquica usando o "single linkage", o "average linkage" e o "complete linkage". Corte as 3 arvores resultantes de tal forma que nos tres casos haja n clusteres onde n é o k bom do item anterior. Plote as clusterizações resultantes. Compare com o resultado do k-means - qual deveria ser teoricamente a mais parecida, e a mais diferente? Estas previsòes acontecem na prática?