Dissertação - Funções de fusão inspiradas na integral de Choquet na camada de pooling de Redes de Aprendizagem Profunda

Autor: Camila Alves Dias (Currículo Lattes)

Resumo

A classificação das imagens é um dos problemas mais estudados na área da visão computacional. Alguns dos problemas enfrentados nesse contexto são, por exemplo, a caracterização de padrões de imagens para distinguir espécies naturais, classificação de dados coletados, que em geral envolvem informações complexas a serem identificadas, exigindo recursos como, por exemplo, ferramentas de aprendizado de máquina, como Convolutional Neural Networks (CNNs) e Deep Learning Networks (DLNs). Esta dissertação de mestrado explora o uso de funções de fusão inspiradas na integral de Choquet na camada de pooling da arquitetura da CNN, apresentando um objetivo geral de duas vias. Primeiramente, estudamos a aplicação de funções de (pré) agregação baseadas nas generalizações da integral de Choquet na redução dimensional da imagem, simulando a camada de pooling de um DLN, comparando tais funções com as usuais utilizadas na literatura (as funções aritméticas máximo e média). A avaliação quantitativa foi feita sobre um conjunto de dados de imagem usando diferentes medidas de qualidade de imagem para comparar os resultados. A segunda parte da dissertação é destinada a introduzir uma função de fusão inspirada na integral de Choquet para a camada de pooling da DLN, definida por uma função de capacidade que é aprendida pela própria rede. Utilizando o CifarNet (uma arquitetura simples para classificar objetos), analisamos a abordagem proposta na classificação das imagens. Os resultados são comparados com os obtidos quando se usa o máximo na camada de pooling.

TEXTO COMPLETO DA DISSERTAÇÃO

Palavras-chave: Integral de ChoquetFunções de agregaçãoIdentificação de capacidadeProcessamento de imagensRede de Aprendizagem Profunda