Dissertação
Reinforcement Learning of Grasping Poses for a Mobile Manipulator APPROVED
Esta tese introduz uma abordagem para agarrar objetos detetados visualmente através da aplicação de um algoritmo de aprendizagem por reforço. A proposta solução de aprendizagem por reforço aprende a adaptar-se continuamente ao ambiente onde está integrada e produz um conjunto de posições para a posição das juntas do manipulador de forma a aproximar-se do objeto detetado e agarrá-lo, enquanto evita colisões. O trabalho é aplicado numa simulação do manipulador móvel TIAGo Steel, da PAL Robotics. O robô TIAGo tem uma base diferencial móvel, um torso extensı́vel, um braço com 7 graus de liberdade equipado com uma mão composta por dois ”dedos” paralelos, uma câmara RGB-D no topo da cabeça e uma câmara adicional montada no pulso. Esta tese descreve uma abordagem baseada em aprendizagem para agarramento robótico que utiliza informação das câmaras RGB-D presentes na configuração. A câmara no topo da cabeça é usada para evitamento de colisões, enquanto que a câmara no pulso é maioritariamnete usada para agarrar com exatidão, tornando a solução imune a erros na cinemática do braço por determinação do erro entre o manipulador e o objeto através de imagem. O algoritmo é treinado num ambiente baseado numa mesa positionada à frente do robô com múltiplos objetos colocados arbitrariamente em cima da mesma. O algoritmo aprendido é capaz de evitar os obstáculos presentes no ambiente e agarrar com sucesso atingindo taxas de acerto de 93.3%. Para treinar a rede de aprendizagem por reforço é usado o motor de simulação Isaac Gym, que facilita treino em paralelo.
Documentos da dissertação ainda não disponíveis publicamente
Orientação
ORIENTADOR
Pedro Manuel Urbano de Almeida Lima
Departamento de Engenharia Electrotécnica e de Computadores
Professor Catedrático