Dissertação
Pedestrian Detection with Multichannel Convolutional Neural Networks EVALUATED
A detecção de pessoas em geral, e a detecção de pedestres (DP) em particular, são tarefas importantes e desafiantes no contexto da interação homem-máquina, com aplicações em vigilância, robótica e Sistemas Avançados de Assistência ao Condutor. Os seus principais desafios devem-se à existência de variabilidade na aparência dos pedestres (e.g. relativamente ao vestuário), e às semelhanças com outros objetos (e.g. sinais de trânsito). Este trabalho propõe um método inovador para abordar o problema de DP, baseado em Redes Neuronais de Convolução (RNC). Mais concretamente, um modelo de RNC foi treinado para cada canal de entrada individual (e.g. RGB ou LUV) e representações de alto nível foram extraídas da penúltima camada. Finalmente, um modelo de RNC para múltiplos canais de entrada foi treinado (parcialmente ou integralmente) com estas representações. Durante o teste, as imagens foram pré-processadas com o detector Aggregated Channels Features (ACF) para gerar janelas candidatas a pedestres. Em seguida, estas janelas foram introduzidas no modelo de RNC para múltiplos canais, sendo efetivamente classificadas como pedestres ou não pedestres. O método desenvolvido é competitivo com o estado da arte, quando avaliado no conjunto de dados INRIA, conduzindo a melhorias relativamente ao método de base (ACF). Foram realizadas duas experiências, nomeadamente, utilizando o INRIA na totalidade com alta resolução, e utilizando parte do INRIA com baixa resolução. Adicionalmente, a metodologia desenvolvida pode ser aplicada com sucesso ao problema de DP em baixa resolução, tendo potencial para ser estendida a outras áreas através da integração de informação proveniente de várias entradas.
dezembro 4, 2015, 15:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Jacinto Carlos Marques Peixoto do Nascimento
Departamento de Engenharia Informática (DEI)
Professor Auxiliar
ORIENTADOR