Dissertação

Automatic Chart Interpretation EVALUATED

Os gráficos são, atualmente, um formato de representação de dados indispensável, sendo utilizados em diversos tipos de documentos. Geralmente, os dados subjacentes às imagens dos gráficos são também considerados cruciais, no entanto, nem sempre estão disponíveis. Um método preciso de extração de dados de gráficos beneficiaria diversas áreas. Esta dissertação propõe o BarXtractor, uma nova ferramenta que extrai dados numéricos e textuais a partir de imagens de gráficos de barras simples, agrupadas e empilhadas. O BarXtractor não requer interação humana, utilizando redes neuronais convolucionais para classificação do tipo de gráfico e Faster R-CNNs na deteção de elementos existentes na imagem do gráfico. Para a extração textual é aplicada uma ferramenta de reconhecimento ótico de caracteres. Adicionalmente, o BarXtractor foi integrado na ferramenta UnchartIt de modo a melhorar a sua precisão e eliminar a necessidade de interação com o utilizador. Os resultados experimentais provaram que o BarXtractor é capaz de classificar, com sucesso, gráficos de barras simples, agrupadas e empilhadas. Além disso, também foi possível verificar que o BarXtractor supera as ferramentas do estado da arte que dependem da interação com o utilizador para a extração correta de dados da imagem do gráfico. Adicionalmente, a integração do BarXtractor no UnchartIt permite melhorar a sua precisão na seleção do programa correto para as várias transformações da tabela original. Finalmente, o BarXtractor também possibilita a extração dos dados textuais dos gráficos, que podem ser utilizados na melhoria da interpretação dos dados numéricos extraídos.
Imagens de gráficos de barras, Extração de dados, Deteção de objetos, Redes Neuronais Convolucionais, Reconhecimento ótico de caracteres.

novembro 16, 2021, 16:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Vasco Miguel Gomes Nunes Manquinho

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Maria Inês Camarate de Campos Lynce de Faria

Departamento de Engenharia Informática (DEI)

Professor Catedrático