Defesa de Dissertação de Mestrado: Henrique Przibisczki de Oliveira
Ranking de Publicações baseado na Extração de Textos da Internet.
| What | Defesa de Mestrado |
|---|---|
| When |
04/12/2009 from 14:00 to 16:00 |
| Where | Sala 316 - IC 3 |
| Add event to calendar |
|
Vários métodos de rankings atuais comparam os diversos veículos de publicação em relação à qualidade, impacto ou abrangência. Esta informação é muito importante para que um pesquisador selecione veículos de renome para publicar suas pesquisas, ou mesmo, instituições podem promover seus pesquisadores baseando-se na qualidade dos locais onde publicam. Esta informação sobre os veículos pode também ser valiosa para um governo destinar recursos às instituições ou uma empresa avaliar a qualidade de um candidato a um emprego.
Existem várias métricas distintas para realizar um ranking de veículos, mas o ponto comum entre a maioria é o uso de citações. Portanto por mais que um veículo seja bastante prestigiado pelos pesquisadores, se ele não for indexado em uma base sua qualidade não será considerada.
Este trabalho pretende realizar um ranking de veículos de publicação obtendo as informações não de uma base de citações existente, mas de uma outra fonte de dados: a Web. As páginas dos professores de universidades são visitadas e delas são extraídas as suas publicações. De cada publicação é extraído o veículo e dessa forma, baseado nos veículos que um pesquisador quis exibir em sua página, os mesmos são ordenados. Este método irá contemplar veículos de publicação não existentes nas atuais bases de dados criando um novo ranking de publicações.
Vários problemas computacionais interessantes são abordados neste trabalho: busca de informação na internet, segmentação textual, extração de componentes em uma referência bibliográfica e agrupamento.
