Dissertação
Estimation of physical properties of objects using vision EVALUATED
Visão Computacional é um campo científico que, nas últimas décadas, tem vindo a ser cada vez mais utilizado nas nossas tarefas do dia-a-dia. Não só é útil para mapeamento e navegação, mas também favorece imenso tarefas de extração de características de objetos, identificação de imagens e reconhecimento de objetos. Relativamente a extração de características de objetos, image2mass e Pix2Vox++ são dois trabalhos que se focam na estimação da massa e na forma de objetos em imagens, respetivamente. Otrabalho proposto tem como objetivo explorar o image2mass, modificando a sua arquitetura com a ajuda do Pix2Vox++. Nesta arquitetura insere-se um Módulo Geométrico que estima uma máscara de expressura e 14 características, usando-as para prever a densidade e o volume dos objetos. Estes valores multiplicados resultam no valor estimado da massa. Assim, neste trabalho, é desenvolvido um método para transformar a saída do Pix2Vox++ numa thickness mask e em 14 características, análogas às do image2mass. É realizado ajuste fino do Pix2Vox++ com configurações diferentes, usando GraspNet, um dataset. Os três melhores modelos obtidos são, então, escolhidos para substituir ou ajudar o Geometry Module e é realizado ajuste-fino do image2mass com o mesmo dataset. Adicionalmente, é feito um processo de aleatoriedade das texturas dos objetos para avaliar a generalização dos resultados. Os resultados obtidos demonstram que o Pix2Vox++ pode talvez ser uma ajuda para o image2mass adquirir um melhor desempenho. No entanto, as configurações do ajuste fino dos dois modelos devem ser mais bem estudadas.
junho 30, 2022, 11:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
José Alberto Rosado dos Santos Victor
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar Convidado