Dissertação
On Planning in Human-Robot Collaboration EVALUATED
A medida que robôs saem de ambientes altamente estruturados e entram em áreas habitadas por humanos, os sistemas autónomos devem aprender a adaptar-se e a cooperar com humanos. A chave para projetar tais sistemas é prever ações com precisão. Pesquisas anteriores focaram-se predominantemente em duas abordagens: 1) recolher dados sobre um determinado problema e fazer o algoritmo perceber os padrões existentes (redes neuronais); 2) descrever as regras do problema e deixar que o algoritmo encontre uma sequência de ações que nos leve de um dado estado inicial a um estado objetivo (planeamento). A primeira abordagem ignora completamente a estrutura do problema. Além disso, a sua forte dependência de dados torna essa estratégia difícil de empregar quando não existe informação disponível. Por outro lado, a segunda abordagem tem dificuldade em encontrar uma solução quando o problema é demasiado complexo. Esta tese propõe uma estratégia de aprendizagem por reforço baseada em modelos, combinando as abordagens mencionadas anteriormente. Ao descrever as regras do ambiente ao algoritmo, ele aprende as ações que o agente robô e o agente humano podem realizar. Em seguida, estima qual opção traz uma maior recompensa conjunta para as entidades com a ajuda de uma “rede de políticas”. Implementamos vários modelos para estudar como o conhecimento sobre possibilidades futuras pode melhorar o comportamento cooperativo do agente robô. O nosso trabalho mostra que focar no objetivo pode levar a uma melhor colaboração humano-robô do que prever o próximo movimento do humano.
dezembro 13, 2022, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
José Alberto Rosado dos Santos Victor
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático