Palestra: ANALISANDO A CONTRIBUIÇÃO REAL DE UM EXEMPLO NA TAREFA DE CLASSIFICAÇÃO AUTOMÁTICA DE DOCUMENTOS.
Profª. Drª. Gisele Lobo Pappa do Departamento de Ciência da Computação da Universidade Federal de Minas Gerais, na Série de Seminários 2010 da Pós-Graduação, dia 26/03/2010, às 14:00 h, Auditório do IC, Sala 85 - IC 2.
| What | Palestra |
|---|---|
| When |
26/03/2010 from 14:00 to 15:00 |
| Where | Auditório do IC - Sala 85 - IC 2 |
| Add event to calendar |
|
Grande parte dos algoritmos de classificação assumem que cada exemplo do conjunto de treinamento contribui igualmente para a construção do modelo de classificação. Esse trabalho estuda essa premissa na tarefa de classificação de documentos, onde mostramos que a contribuição de um documento para o modelo depende diretamente de seu conteúdo e idade, e também pode ser influenciada por sua fonte, autores, etc. Inicialmente, propomos um algoritmo de programação genética para estimar uma função capaz de ponderar a contribuição dos documentos de acordo com seu conteúdo. Num segundo momento, mostramos que o impacto da idade de um documento em modelos de classificação obedece uma função normal, que também pode ser usada para ponderação. Os classificadores Naive-Bayes, KNN e Rocchio foram adaptados para considerar diferentes contribuições dos documentos com base em funções de ponderação, e experimentos mostraram que tal modificação melhorou significativamente a acurácia desses classificadores.
