Dissertação - Redes neurais em grafos : um benchmarking de métodos de classificação de documentos de engenharia

Autor: Vanessa Telles da Silva (Currículo Lattes)

Resumo

A criação de novos dados cresce em um ritmo acelerado, trazendo benefícios para a sociedade. No entanto, o volume de dados, tanto estruturado quanto não estruturado, se mostra um desafio considerável em entregar acesso imediato dos dados aos usuários. A Transformação Digital propõe avanços quanto ao manuseio de dados digitais e documento impressos na gestão centrada em documentos nas mais diversas áreas de atuação. Essa tarefa é essencial pois é responsável por informar e guiar os membros da equipe em projeto na área de construção, montagem e em engenharia. É comum que organizações dessa natureza trabalharem com centenas, ou até milhares, de documentos técnicos, usualmente impressos, como plantas industriais, ordens de compra para peças, certificados de qualidades, ensaios com material e outros tipos. Com demanda atual da indústria por eficiência, a inspeção manual dos documentos técnicos é custosa. Neste contexto, aplicações de cenários reais se beneficiariam com a implementação de um sistema automático de classificação que consiga lidar com o grande volume de dados existentes. As soluções propostas atualmente tem como base a utilização de um grande volume de dados e acabam negligenciando o fato de que estes documentos podem estar interligados. O trabalho aqui propostos tem como objetivo aprofundar a compreensão quanto ao desempenho de Redes Neurais baseada em Grafos (GNN), com uma abordagem simples e eficiente para a classificação de documentos. Os resultados deste trabalho indicam que modelos de GNN com aprendizado semi-supervisionado podem ser escolhas de projeto problemáticas quando os dados da aplicação tem alto grau de relacionamentos e estes elos advêm de relações indiretas. Mostrando a necessidade de se repensar as metodologias atuais em projetos de aprendizado de máquina, trazendo a discussão para o espaço de dados. O trabalho propõe implementar a exploração do Data Space aos passos que compõem projetos de GNN. Essa abordagem alinha-se à tendência atual do aprendizado de máquina centrado no dado data-centric.

TEXTO COMPLETO

Palavras-chave: Redes neuraisGrafosDeep learningAprendizado semi-supervisionado