Dissertação

Next best view for object model aquisition EVALUATED

O problema da próxima melhor vista (Next Best View) é um problema de visão computacional bastante estudado em robótica. Vários modelos de aprendizagem profunda têm sido propostos ao longo dos anos para resolver este problema com sucesso. As previsões obtidas com o apoio de modelos de aprendizagem profunda têm, como é natural, alguma incerteza associada, no entanto os modelos padrão não permitem o cálculo desta incerteza. A teoria da estimação bayesiana contribuiu para demonstrar que as camadas de Dropout podem ser usadas para estimar a incerteza da previsão em redes neuronais. Esta tese adapta a arquitetura da rede neuronal baseada na rede point-net para previsão da próxima melhor vista, PC-NBV, incorporando camadas de Dropout, permitindo assim o cálculo da estimativa da incerteza associada às previsões. Esta tese tem como objetivo melhorar a precisão da rede no que toca à previsão correta do próximo melhor ponto de vista, propondo assim uma forma de tornar o processo de reconstrução 3D mais eficiente. Estudam-se várias métricas de incerteza das precisões que sejam capazes de modelar o erro e a precisão da previsão. Conseguem-se obter duas medidas de incerteza que possibilitam a redução do erro do modelo e o aumento da precisão do modelo de 30% para 80% através da identificação e desconcideração de previões com incerteza alta. Propõe-se ainda um método para utilização direta das métricas de incerteza para melhoria da previsão final, este método apresenta no entando melhorias muito residuais.
Próxima Melhor Vista, Quantificação da Incerteza, Robótica, Redes de Aprendizagem Profunda

junho 24, 2024, 11:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Plinio Moreno López

ISR

Investigador

ORIENTADOR

José Alberto Rosado dos Santos Victor

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático