Dissertação - Planejamento de Próximo Melhor Ponto de Vista com Imagens Multi-domínio Baseado em Aprendizado por Reforço Profundo

Autor: Matheus Gonçalves Mateus (Currículo Lattes)

Resumo

Em ambientes offshore, o monitoramento de estruturas dispostas no multi-domínio ar-água é uma tarefa importante que muitas vezes depende da utilização de veículos não-tripulados para sua execução. O monitoramento é principalmente feito através de mapeamento com a reconstrução das estruturas, utilizando nuvens de pontos coletadas através de sensores como Lidars, sonares e câmeras embarcados ao veículo. O ambiente offshore é propício ao uso de um veículo híbrido aéreo-aquático não-tripulado - HUAUV, já que esse é um tipo de veículo que pode atuar livremente nos domínios ar-água, além da transição entre eles. A problemática de mapeamento propõe uma série de desafios se tratando da autonomia de veículos. Um dos principais problemas é com relação ao caminho para cobrir de forma eficiente a estrutura, sendo agravado pela problemática multi-domínio, ocasionando no problema de planejamento de próximo melhor ponto de vista - NBV. Por tanto, é proposto no presente trabalho, considerando um HUAUV, um planejador de NBV, não-baseado em modelo, capaz de atuar em multi-domínio para a cobertura de estruturas. A cobertura da estrutura é dada a partir de uma câmera estéreo, viável no ar e na água, tendo as nuvens de pontos extraídas da fusão de imagens RGB e de profundidade. O método proposto descreve um modelo de uma abordagem contrastiva panóptica de ocupação cross-modal, como uma representação para aprendizado por reforço profundo. Para isso, é feita a união das imagens RGB, profundidade e segmentação semântica da estrutura (2D) com nuvens de pontos (3D). O comportamento do HUAUV é definido por posições (x, y e z) e orientações, no corpo do veículo e diretamente na câmera empregando um comportamento com 5-DoF. Dado o funcionamento das abordagens de aprendizado utilizadas, a informação cross-modal é utilizada apenas durante o treinamento. O que implica em uma única entrada para o planejador, a imagem RGB da cena, caracterizando o método não-baseado em modelo, ou seja, sem conhecimento da forma da estrutura. Com o método proposto o agente foi capaz de encontrar as vistas que compõem o caminho com a melhor relação eficiência x qualidade na reconstrução, considerando a transição multi-domínio. O trabalho demonstrou resultados satisfatórios quanto à reconstrução de estruturas, destacando-se com relação à abordagem na qual foi embasada e também com relação ao estado-da-arte.

TEXTO COMPLETO DA DISSERTAÇÃO

Palavras-chave: Planejamento de próximo melhor ponto de vistaAprendizado por reforço profundoAmbiente offshoreAmbiente marinhoVeículos guiados remotamenteMonitoramento