Dissertação
Learning to search for objects in foveal images using deep Learning EVALUATED
O ser humano não tem a capacidade de processar o que observa no seu campo de visão de forma instantânea. Por essa razão, existe um conjunto de mecanismos que permitem controlar a resposta a estímulos visuais. Este conjunto de mecanismos é o que define a atenção visual. No domínio da computação visual, o problema de modelação da atenção visual tem sido estudado e várias soluções têm sido propostas. Em particular, os modelos baseados em saliências têm como objetivo estimar a distribuição espacial de fixações humanas numa imagem. Contudo, a maioria dos modelos têm uma abordagem bottom-up, baseada na influência de estímulos visuais. Esta abordagem não modela a atenção visual ao longo do tempo, ignorando as depências temporais subjacentes às sequência de fixações. O nosso modelo prevê sequências temporais de fixações enquanto executa uma tarefa, que constitui informação top-down. A previsão de fixações futuras é feita a partir da informação que foi conservada ao longo do tempo de fixações passadas e da tarefa. No entanto, o modelo apenas prevê sequências de fixações com um comprimento fixo e não tem a capacidade de decidir parar ou continuar a procura. O objetivo é adicionar esta capacidade. Também introduzimos uma nova representação da tarefa e conduzimos experiências para a recolha de dados de fixações humanas. Em suma, as nossas contribuições são: (i) aquisição de dados de fixações humanas; (ii) introdução de uma nova representação da tarefa; (iii) duas soluções para o problema da deteção da presença do objeto.
junho 28, 2022, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
José Alberto Rosado dos Santos Victor
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático