::: Anderson Rocha .:. Institute of Computing (UNICAMP), Brazil :::

PhD

Project description

Institution: Institute of Computing at State University of Campinas

Theme: Design and Deployment of Machine Learning techniques to solve problems in Digital Image Processing and Computer Vision.

Start: March 1^st, 2006. End: March 3^rd, 2009.

Thesis: Classifiers and Machine Learning in Image Processing and Computer Vision.

Defense date: March 3^rd, 2009.

Examining Committee:
- Prof. Fabio Gagliardi Cozman (PhD. Poli-USP)
- Prof. Luciano da Fontoura Costa (PhD. USP-São Carlos)
- Prof. Ricardo Dahab (PhD. Unicamp)
- Prof. Roberto de Alencar Lotufo (PhD. Unicamp)

Advisor: Prof. Siome Klein Goldenstein (PhD. at UPENN and Posdoc at Rutgers University).

Fellowship: FAPESP - Fundação de Amparo a Pesquisa do Estado de São Paulo.

Related publications: please access my publications area.

Available documents

PhD thesis: Classificadores e Aprendizado em Processamento de Imagens e Visão Computacional. Thesis presented to and approved by the examining committee on March 3^rd, 2009 at Instituto de Computação, Universidade Estadual de Campinas. Campinas, SP, Brasil.

Resumo:

Neste trabalho de doutorado, propomos a utilização de classificadores e técnicas de aprendizado de máquina para extrair informações relevantes de um conjunto de dados (e.g., imagens) para solução de alguns problemas em Processamento de Imagens e Visão Computacional.

Os problemas de nosso interesse são: categorização de imagens em duas ou mais classes, detecção de mensagens escondidas, distinção entre imagens digitalmente adulteradas e imagens naturais, autenticação, multi-classificação, entre outros.

Inicialmente, apresentamos uma revisão comparativa e crítica do estado da arte em análise forense de imagens e detecção de mensagens escondidas em imagens. Nosso objetivo é mostrar as potencialidades das técnicas existentes e, mais importante, apontar suas limitações. Com esse estudo, mostramos que boa parte dos problemas nessa área apontam para dois pontos em comum: a seleção de características e as técnicas de aprendizado a serem utilizadas. Nesse estudo, também discutimos questões legais associadas a análise forense de imagens como, por exemplo, o uso de fotografias digitais por criminosos.

Em seguida, introduzimos uma técnica para análise forense de imagens testada no contexto de detecção de mensagens escondidas e de classificação geral de imagens em categorias como indoors, outdoors, geradas em computador e obras de arte.

Ao estudarmos esse problema de multi-classificação, surgem algumas questões: como resolver um problema multi-classe de modo a poder combinar, por exemplo, características de classificação de imagens baseadas em cor, textura, forma e silhueta, sem nos preocuparmos demasiadamente em como normalizar o vetor-comum de características gerado? Como utilizar diversos classificadores diferentes, cada um, especializado e melhor configurado para um conjunto de características ou classes em confusão? Nesse sentido, apresentamos, uma técnica para fusão de classificadores e características no cenário multi-classe através da combinação de classificadores binários. Nós validamos nossa abordagem numa aplicação real para classificação automática de frutas e legumes.

Finalmente, nos deparamos com mais um problema interessante: como tornar a utilização de poderosos classificadores binários no contexto multi-classe mais eficiente e eficaz? Assim, introduzimos uma técnica para combinação de classificadores binários (chamados classificadores base) para a resolução de problemas no contexto geral de multi-classificação.

Abstract

In this work, we propose the use of classifiers and machine learning techniques to extract useful information from data sets (e.g., images) to solve important problems in Image Processing and Computer Vision.

We are particularly interested in: two and multi-class image categorization, hidden messages detection, discrimination among natural and forged images, authentication, and multi-classification.

To start with, we present a comparative and evaluative survey of the state-of-the-art in digital image forensics as well as hidden messages detection. Our objective is to show the importance of the existing solutions and discuss their limitations. In this study, we show that the vast majority of these techniques point to two directions: the feature selection and the machine learning techniques to be used. Furthermore, we discuss the legal and ethical aspects of image forensics analysis, such as, the use of digital images by criminals.

We introduce a technique for image forensics analysis in the context of hidden messages detection and image classification in categories such as indoors, outdoors, computer generated, and art works.

From this multi-class classification, we found some important questions: how to solve a multi-class problem in order to combine, for instance, several different features such as color, texture, shape, and silhouette without worrying about the pre-processing and normalization of the combined feature vector? How to take advantage of different classifiers, each one custom tailored to a specific set of classes in confusion? To cope with most of these problems, we present a feature and classifier fusion technique based on combinations of binary classifiers. We validate our solution with a real application for automatic produce classification.

Finally, we address another interesting problem: how to combine powerful binary classifiers in the multi-class scenario more effectively? How to boost their efficiency? In this context, we present a solution that boosts the efficiency and effectiveness of multi-class from binary techniques.

(PDF)