Dissertação
Next best view for object model aquisition EVALUATED
O problema da próxima melhor vista (Next Best View) é um problema de visão computacional bastante estudado em robótica. Vários modelos de aprendizagem profunda têm sido propostos ao longo dos anos para resolver este problema com sucesso. As previsões obtidas com o apoio de modelos de aprendizagem profunda têm, como é natural, alguma incerteza associada, no entanto os modelos padrão não permitem o cálculo desta incerteza. A teoria da estimação bayesiana contribuiu para demonstrar que as camadas de Dropout podem ser usadas para estimar a incerteza da previsão em redes neuronais. Esta tese adapta a arquitetura da rede neuronal baseada na rede point-net para previsão da próxima melhor vista, PC-NBV, incorporando camadas de Dropout, permitindo assim o cálculo da estimativa da incerteza associada às previsões. Esta tese tem como objetivo melhorar a precisão da rede no que toca à previsão correta do próximo melhor ponto de vista, propondo assim uma forma de tornar o processo de reconstrução 3D mais eficiente. Estudam-se várias métricas de incerteza das precisões que sejam capazes de modelar o erro e a precisão da previsão. Conseguem-se obter duas medidas de incerteza que possibilitam a redução do erro do modelo e o aumento da precisão do modelo de 30% para 80% através da identificação e desconcideração de previões com incerteza alta. Propõe-se ainda um método para utilização direta das métricas de incerteza para melhoria da previsão final, este método apresenta no entando melhorias muito residuais.
junho 24, 2024, 11:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
José Alberto Rosado dos Santos Victor
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático