Dissertação
Semantic-Based Active Perception for Humanoid Visual Tasks: Scene Exploration and Visual Search in Foveal Scenes using Deep Object Detection Models EVALUATED
Neste trabalho, estuda-se até que ponto um modelo de perceção ativa foveal baseado, baseado em informação semântica, é capaz de completar tarefas visuais que são regularmente praticadas por humanos, nomeadamente, exploração do campo visual e a procura visual de objetos. Para o efeito, a precisão do modelo baseado em informação semântica é comparada com a de um modelo tradicional baseado em análise de saliência, derivado de desenvolvimentos nos domínios da neurologia e da psicologia, que tenta reproduzir aspetos da cognição visual humana. Relativamente à tarefa de exploração de cenários visuais, a abordagem baseado em informação semântica supera de forma convincente o modelo tradicional, baseado em saliência, quando se trata de mapear com precisão o conteúdo semântico contido no campo visual. À luz das experiências de procura visual, concluiu-se que uma abordagem preditiva em informação semântica supera significativamente o modelo de saliência, bem como uma seleção aleatória do próximo ponto focal, tanto em termos de precisão como de custo computacional relativo. Estes últimos resultados foram obtidos durante a procura de instâncias de uma classe-alvo num campo visual, na presença de múltiplos objetos de distração.
novembro 30, 2023, 11:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Alexandre José Malheiro Bernardino
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado