Dissertação - 3D reconstruction and elevation angle estimation on underwater sonar data

Autor: Guilherme Correa de Oliveira (Currículo Lattes)

Resumo

A exploração subaquática possui diversas características referentes ao seu meio que limitam o uso de câmeras ópticas, tornando os sonares de imageamento uma alternativa viável. No entanto, as imagens de sonar são inerentemente ambíguas e ruidosas, o que complica sua interpretação para a reconstrução 3D. Embora o aprendizado de máquina possa mitigar esses problemas, sua aplicação é restringida pela escassez de datasets. Esta dissertação aborda esses desafios ao introduzir uma metodologia baseada em aprendizado profundo para corrigir a ambiguidade de imagens de sonar, estimando o ângulo de elevação para a realização de reconstrução 3D. Uma das principais contribuições deste trabalho é o desenvolvimento de um dataset chamado: Synthetic Enclosed Echoes (SEE), o qual é constituído tanto por dados sintéticos quanto reais, criado em um ambiente de simulação de alta fidelidade que replica um tanque de testes físico. Para processar esses dados, propomos o ElevateNET-R, uma rede neural baseada em regressão e adaptada para prever o ângulo de elevação por pixel a partir de uma única imagem de sonar 2D. Experimentos quantitativos demonstram que o modelo ElevateNET-R proposto supera consistentemente os métodos existentes na literatura, incluindo abordagens clássicas e outros modelos baseados em aprendizado. Além disso, a eficácia da metodologia foi validada em um experimento de simulação para o real (sim-to-real), no qual o modelo, treinado exclusivamente com o conjunto de dados sintético SEE, realizou com sucesso a reconstrução 3D de dados de sonar do mundo real. As principais contribuições são a disponibilização pública do conjunto de dados SEE e seu ambiente de simulação para fomentar futuras pesquisas e a validação bem-sucedida de uma rede baseada em regressão para a correção da ambiguidade em sonares.

TEXTO COMPLETO

Palavras-chave: Engenharia de computaçãoSonarImagemImagem 3DAprendizagem profundaImagens de sonarRobótica subaquáticaReconstrução de imagemReconstrução tridimensional