Dissertação

{en_GB=Feature Engineering Automation for Time Series Analysis} {} EVALUATED

{pt=Recentemente, dados de series temporais têm sido os tipos de dados que mais crescem, uma vez que tanto pessoas como negocios medem normalmente os seus desempenhos ao longo de um periodo de tempo. Series temporais são normalmente associadas à tarefa de previsão de dados. Para fazer previsões, um cientista de dados necessita de extrair características que ajudem a descrever o comportamento dos dados. Para ajudar os cientistas de dados, tem sido propostas ferramentas para automatizar o processo de ciência de dados, noutros campos de pesquisa, como por exemplo na classificação de dados tabulares, mas não aplicado a séries temporais. Neste trabalho, descrevemos as principais ferramentas de Automatização de Aprendizagem Máquina e propomos uma nova ferramenta que automatiza o processo de criação de um processo de análise de séries temporais. O foco está na extração de características descriptivas que se adaptem aos dados. Essas características são agregadas em conjuntos, avaliadas e selecionadas para o modelo. Com este trabalho, pretendemos desenvolver uma ferramenta que reduza o trabalho do cientista de dados durante o desenvolvimento de um processo de análise de séries. Desta forma o cientista pode concentrar-se na análise de resultados., en=In recent years, time series data have been one of the most growing types of data since people and business usually measure their performance over a period of time. Temporal data are usually associated with the task of forecast. To forecast, a data scientist needs to create features that help describe the behavior of data. To help data scientists, there have been proposed frameworks that automate the data science pipeline in other fields of research, for example for classification of tabular data, but not for time series. In this work, we describe the main Automate Machine Learning frameworks and propose a new framework that automates the process of creating a pipeline of analysis of time series. The focus is on creating descriptive features, that adapt to the data. Those features are aggregated in sets and they are evaluated and selected for the model. With this work, we aim to deliver a tool that will reduce data scientists’ work developing pipelines of analysis, and help them concentrate on the analysis of results.}
{pt=Automatização de Aprendizagem Máquina, Aprendizagem Máquina, Séries Temporais, Extração de Características, XGBoost., en=AutoML, Machine Learning, Time Series, Feature Engineering, XGBoost.}

janeiro 21, 2021, 18:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Claudia Martins Antunes

Departamento de Engenharia Informática (DEI)

Professor Associado