Defesa de Doutorado de Jaudete Daltio

Título do Trabalho
Views over Graph Databases: A Multifocus Approach for Heterogeneous Data
Candidato(a)
Jaudete Daltio
Nível
Doutorado
Data
Add to Calender 2017-09-04 00:00:00 2017-09-04 00:00:00 Defesa de Doutorado de Jaudete Daltio Views over Graph Databases: A Multifocus Approach for Heterogeneous Data Auditório do IC 2 - Sala 85 INSTITUTO DE COMPUTAÇÃO mauroesc@ic.unicamp.br America/Sao_Paulo public
Horário
10:00
Local
Auditório do IC 2 - Sala 85
Orientador(a)
Claudia Maria Bauzer Medeiros
Banca Examinadora

Titulares:
Claudia Maria Bauzer Medeiros (IC/UNICAMP)
Ana Carolina Brandão Salgado (CInf/UFPE)
Ricardo Rodrigues Ciferri (DC/UFSCar)
André Santanchè (IC/UNICAMP)
Guilherme Pimentel Telles (IC/UNICAMP)
Suplentes:
Breno Bernard Nicolau de França (IC/UNICAMP)
Edmundo Roberto Mauro Madeira (IC/UNICAMP)
Otávio Augusto Bizetto Penatti (Samsung Research)

Resumo

A pesquisa científica tornou-se intensamente usuária e dependente de dados. Esse novo paradigma de pesquisa demanda técnicas e tecnologias computacionais sofisticadas para apoiar tanto o ciclo de vida dos dados científicos como a colaboração entre cientistas de diferentes áreas. Uma demanda recorrente em equipes multidisciplinares é a construção de múltiplas perspectivas sobre um mesmo conjunto de dados. Soluções atuais cobrem vários aspectos, desde o projeto de padrões de interoperabilidade ao uso de sistemas de gerenciamento de bancos de dados não-relacionais. Entretanto, nenhum desses esforços atende de forma adequada a necessidade de múltiplas perspectivas, denominadas focos nesta tese. Em termos gerais, um foco é projetado e construído para atender um determinado grupo de pesquisa (mesmo no escopo de um único projeto) que necessita manipular um subconjunto de dados de interesse em múltiplos níveis de agregação/generalização. A definição e criação de um foco são tarefas complexas que demandam mecanismos capazes de manipular múltiplas representações de um mesmo fenômeno do mundo real. O objetivo desta tese é prover multiplos focos sobre dados heterogêneos. Para atingir esse objetivo, esta pesquisa se concentrou em quatro principais problemas. Os problemas incialmente abordados foram: (1) escolher um paradigma de gerenciamento de dados adequado e (2) elencar os principais requisitos de pesquisas multifoco. Nossos resultados nos direcionaram para a adoção de bancos de dados de grafos como solução para o problema (1) e a utilização do conceito de visões, de bancos de dados relacionais, para o problema (2). Entretanto, não há consenso sobre um modelo de dados para bancos de dados de grafos e o conceito de visões é pouco explorado nesse contexto. Com isso, os demais problemas tratados por esta pesquisa são: (3) a especificação de um modelo de dados de grafos e (4) a definição de um framework para manipular visões em bancos de dados de grafos. Nossa pesquisa nesses quatro problemas resultaram nas contribuições principais desta tese: (i) apontar o uso de bancos de dados de grafos como camada de persistência em pesquisas multifoco -- um tipo de banco de dados de esquema flexível e orientado a relacionamentos que provê uma ampla compreensão sobre as relações entre os dados; (ii) definir visões para bancos de dados de grafos como mecanismo para manipular múltiplos focos, considerando operações de manipulação de dados em grafos, travessias e algoritmos de grafos; (iii) propor de um modelo de dados para grafos -- baseado em grafos de propriedade -- para lidar com a ausência de um modelo de dados pleno para grafos; (iv) especificar e implementar um framework, denominado Graph-Kaleidoscope, para prover o uso de visões em bancos de dados de grafos e (v) validar nosso framework com dados reais em aplicações distintas - em biodiversidade e em recursos naturais - dois típicos exemplos de pesquisas multidisciplinares que envolvem a análise de interações de fenômenos a partir de dados heterogêneos.