Defesa de Mestrado de Guilherme Vieira Leite

Título do Trabalho
Detecção de Quedas de Pessoas em Vídeos Utilizando Redes Neurais Convolucionais com Múltiplos Canais
Candidato(a)
Guilherme Vieira Leite
Nível
Mestrado
Data
Add to Calender 2020-02-14 00:00:00 2020-02-14 00:00:00 Defesa de Mestrado de Guilherme Vieira Leite Detecção de Quedas de Pessoas em Vídeos Utilizando Redes Neurais Convolucionais com Múltiplos Canais Auditório 1 do IC 3 INSTITUTO DE COMPUTAÇÃO mauroesc@ic.unicamp.br America/Sao_Paulo public
Horário
13:30
Local
Auditório 1 do IC 3
Orientador(a)
Hélio Pedrini
Banca Examinadora

* Titulares

Unidade/Instituição

Hélio Pedrini

IC/UNICAMP

Gabriel Martins Dias

Semantix Brasil

Esther Luna Colombini

IC/UNICAMP

 

* Suplentes

Unidade/Instituição

André Santanchè

IC/UNICAMP

Moacir Antonelli Ponti

ICMC/USP

Resumo

Baixas taxas de mortalidade infantil, avanços na medicina e mudanças culturais aumentaram a expectativa de vida nos países desenvolvidos para mais de 60 anos. Alguns países esperam que, até 2030, 20% da sua população tenham mais de 65 anos. A qualidade de vida nessa idade avançada é altamente determinada pela saúde do indivíduo, que ditará se o idoso pode se engajar em atividades importantes para o seu bem estar, independência e satisfação pessoal. O envelhecimento é acompanhado por problemas de saúde causados por limitações biológicas e fraqueza muscular. Esse enfraquecimento facilita a ocorrência de quedas, responsáveis pela morte de aproximadamente 646.000 pessoas em todo o mundo e, mesmo quando uma pequena queda ocorre, ela ainda pode fraturar ossos ou danificar tecidos moles, que não cicatrizam completamente. Lesões e danos dessa natureza, por sua vez, podem afetar a autoconfiança do indivíduo, diminuindo sua independência. Neste trabalho, propomos um método capaz de detectar quedas humanas em sequências de vídeo usando redes neurais convolucionais. Nosso método utiliza características extraídas previamente de cada quadro do vídeo e as classifica. Após a etapa de classificação, uma máquina de vetores de suporte é aplicada para ponderar os canais de entrada e indicar se houve ou não uma queda. Experimentamos quatro tipos de características, a saber: (i) fluxo óptico, (ii) ritmo visual, (iii) estimativa de pose e (iv) mapa de saliência. As bases de dados utilizadas (URFD e FDD) estão disponíveis publicamente e nossos resultados são comparados com os da literatura. As métricas selecionadas para avaliação são acurácia, sensibilidade e especificidade. Nossos resultados são competitivos com os obtidos pelo estado da arte na base de dados URFD e superam os obtidos na base de dados FDD. O método proposto é capaz de detectar quedas nas bases selecionadas. A detecção de quedas, bem como a classificação de atividades em vídeos, está fortemente relacionada à capacidade da rede de interpretar informações temporais e, como esperado, o fluxo óptico é a características mais relevante para a detecção de quedas.