Dissertação - Avaliação de qualidade em Imagens de documentos técnicos usando fusão de métricas

Autor: Lucas Viana da Silva (Currículo Lattes)

Resumo

Reconhecimento óptico de caracteres (OCR) e restauração de documentos são duas aplicações em que fazer a avaliação da qualidade da imagem do documento (DIQA) é necessária para entender os problemas que podem surgir ao tentar processar um documento específico. Documentos técnicos, contendo formas complexas como tabelas e carimbos/assinaturas, apresentam comportamento diferente na saída de um OCR dependendo de qual componente do documento está sendo analisado, fazendo com que ocorra problemas ao utilizar os modelos de DIQA atuais. Este estudo analisará estas diferenças de comportamento e proporá um método para a utilização de DIQA neste tipo de documento, separando os componentes do mesmo e tratando cada um deles de forma separada. Os resultados obtidos mostram uma melhora perto de 14% em comparação com técnicas do estado da arte atual para documentos que incluem formas complexas como tabelas e carimbos, adicionando uma nova ferramenta relativamente simples para tarefas de DIQA.

TEXTO COMPLETO

Palavras-chave: Reconhecimento Óptico de Caracteres (OCR)Machine learningQualidadeAvaliação da Qualidade da Imagem (IQA)