Dissertação

{en_GB=Rethinking Video Interfaces for Usability and Editor's Performance} {} EVALUATED

{pt=Com a rápida evolução das plataformas que incorporam video nos últimos anos, surgiu uma grande procura na inserção de legendas. Com tal crescimento, novas estratégias para a sua produção também surgiram, especialmente com o uso de inteligência artificial e estratégias de design para o seu desenvolvimento. Com base, procurámos soluções propostas por investigadores na produção de transcrições e legendas cujo impacto tenha sido considerável e atual. Após tal investigação e experiências propomos um novo fluxo na criação de legendas, sem precedentes. Adicionalmente, exploramos uma maneira inovadora de exibir texto na transcrição de um vídeo com a assistência de Inteligência Artificial. Com resultados promissores, mas não conclusivos. Os nossos resultados mostram que uma abordagem semelhante a um editor de texto integrado com tecnologias de reconhecimento da fala para a edição de transcrição, pode ser uma maneira promissora para assistir os editores com trabalhos de transcrição., en=With the ever-growing demand for video captions, the focus has turned into assisting humans with AI and Design strategies in order to make them faster and better. We take a look into the state of the art solutions for transcription and caption production and some implementations from researchers and companies whose impact in this industry has been considerable. With that, we propose a new flow to create captions which is unprecedented. Furthermore, we explore an innovative way to display the text when transcribing a video with AI assistance, with promising, but not conclusive results. Our results show that a text-editor approach integrated with Automatic speech recognition (ASR) technology for transcription editing could be the optimal way to assist humans with ASR baselines for transcription.}
{pt=Reconhecimento automático de voz, Legendas, Transcrição, Tempo de resposta, Taxa de erro de palavras, en=Automatic speech recognition, computer-assisted speech recognition, Captions, Transcription, turnaround-time, Word-Error-Rate}

setembro 29, 2020, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Duarte Nuno Jardim Nunes

Departamento de Engenharia Informática (DEI)

Professor Catedrático