PhD thesis:
Classificadores e Aprendizado em Processamento de Imagens e Visão Computacional.
Thesis presented to and approved by the
examining committee on March 3rd, 2009 at Instituto
de Computação, Universidade Estadual de
Campinas. Campinas, SP, Brasil.
Resumo:
Neste trabalho de doutorado, propomos a utilização de classificadores e
técnicas de aprendizado de máquina para extrair informações
relevantes de um conjunto de dados (e.g., imagens) para solução de
alguns problemas em Processamento de Imagens e Visão Computacional.
Os problemas de nosso interesse são: categorização de
imagens em duas ou mais classes, detecção de mensagens escondidas,
distinção entre imagens digitalmente adulteradas e imagens naturais,
autenticação, multi-classificação, entre outros.
Inicialmente, apresentamos uma revisão comparativa e crítica
do estado da arte em análise forense de imagens e detecção de mensagens
escondidas em imagens. Nosso objetivo é mostrar as potencialidades das
técnicas existentes e, mais importante, apontar suas limitações.
Com esse estudo, mostramos que boa parte dos problemas nessa área
apontam para dois pontos em comum: a seleção de características e as
técnicas de aprendizado a serem utilizadas. Nesse estudo, também
discutimos questões legais associadas a análise forense de imagens
como, por exemplo, o uso de fotografias digitais por criminosos.
Em seguida, introduzimos uma técnica para análise forense de imagens
testada no contexto de detecção de mensagens escondidas
e de classificação geral de imagens em categorias como indoors, outdoors, geradas em
computador e obras de arte.
Ao estudarmos esse problema de multi-classificação, surgem algumas questões: como resolver um
problema multi-classe de modo a poder combinar, por exemplo, características de classificação
de imagens baseadas em cor, textura, forma e silhueta, sem nos preocuparmos demasiadamente em como normalizar o
vetor-comum de características gerado? Como utilizar diversos classificadores diferentes, cada
um, especializado e melhor configurado para um conjunto de
características ou classes em confusão? Nesse sentido,
apresentamos, uma técnica para fusão de classificadores e características no cenário
multi-classe através da combinação de classificadores binários. Nós validamos
nossa abordagem numa aplicação real para classificação automática de frutas e
legumes.
Finalmente, nos deparamos com mais um problema interessante: como tornar a utilização de poderosos
classificadores binários no contexto multi-classe mais eficiente e eficaz? Assim, introduzimos uma
técnica para combinação de classificadores binários (chamados classificadores base)
para a resolução de problemas no contexto geral de multi-classificação.
Abstract
In this work, we propose the use of classifiers and machine learning techniques to extract useful information
from data sets (e.g., images) to solve important problems in Image Processing and Computer Vision.
We are particularly interested in: two and multi-class image categorization, hidden messages detection,
discrimination among natural and forged images, authentication, and multi-classification.
To start with, we present a comparative and evaluative survey of the state-of-the-art in digital image forensics as
well as hidden messages detection. Our objective is to show the importance of the existing solutions and discuss
their limitations. In this study, we show that the vast majority of these techniques point to two directions: the
feature selection and the machine learning techniques to be used. Furthermore, we discuss the legal and ethical
aspects of image forensics analysis, such as, the use of digital images by criminals.
We introduce a technique for image forensics analysis in the context of hidden messages detection and image
classification in categories such as indoors, outdoors, computer generated, and
art works.
From this multi-class classification, we found some important questions: how to solve a multi-class problem in
order to combine, for instance, several different features such as color, texture, shape, and silhouette without
worrying about the pre-processing and normalization of the combined feature vector? How to take advantage of
different classifiers, each one custom tailored to a specific set of classes in confusion? To cope with most of
these problems, we present a feature and classifier fusion technique based on combinations of binary classifiers.
We validate our solution with a real application for automatic produce classification.
Finally, we address another interesting problem: how to combine powerful binary classifiers in the multi-class
scenario more effectively? How to boost their efficiency? In this context, we present a solution that boosts the
efficiency and effectiveness of multi-class from binary techniques.
|
|
(PDF)
| |