Dissertação

{en_GB=Detection of Fraud, Abuse and Cost Inefficiencies in the National Healthcare System} {} EVALUATED

{pt=No mundo actual a fraude e abuso na área da saúde atingiu proporções enormes. A cada ano milhões de dólares são perdidos no sistema nacional de saúde devido à fraude. É portanto importante desenvolver sistemas que possam combater e prevenir de forma eficiente este comportamento. Esta dissertação propõe uma solução para o problema da detecção de fraude e abuso no sistema nacional de saúde. A abordagem escolhida pode ser dividida em três fases principais. Na primeira fase, é utilizado um gerador de dados de modo a criar um dataset constituído por prescrições e distribuições geográficas. Na segunda fase, são usados dois algoritmos distintos para detectar comportamento fraudulento, nomeadamente um algoritmo baseado em geolocalização e um baseado em regras médicas e farmacéuticas. Na última fase, o output de ambos os algoritmos é analisado e os casos fraudulentos são enviados a especialistas, para que seja realizada uma investigação mais aprofundada. Usando o dataset das prescrições, o valor obtido para o recall, utilizando 10-fold cross validation, é de 0.33 cujo valor não é muito alto para esta métrica. No entanto, utilizando o dataset das distribuições geográficas obtém-se um recall de 0.69, o que é um bom resultado. Uma nova abordagem é tomada neste trabalho, projectando e implementando um gerador de dados que tem a capacidade de criar dados para um grande número de algoritmos. Esta abordagem permite que haja uma redução de custos visto que apenas uma porção dos casos serão enviados para investigação futura, tornando o serviço mais barato e eficiente., en=In today’s world healthcare fraud and abuse has taken enormous proportions. Every year millions of dollars are lost in the healthcare system due to fraud. It is therefore important to develop systems that can efficiently combat and prevent this behaviour. This dissertation proposes a solution for the problem of detecting fraud and abuse in the healthcare system. The chosen approach can be divided into three main phases. In the first phase, a data generator is used to create a dataset composed by prescriptions and geographical distributions. In the second phase, two different algorithms are used to detect fraudulent behaviour, namely a geo-location based and a rule based algorithm. In the last phase, the output of both algorithms is analysed and the fraudulent claims are sent for further investigation. Using the prescriptions dataset the obtained value for the recall, when using 10-fold cross validation, is of 0.33 which is not a very high value. However using the geographical distributions dataset a recall of 0.69, again using 10-fold, is obtained which is a good result for this measure. A novel approach is taken in this work by designing and implementing a data generator that can create data for a plethora of algorithms. Using this approach allows for cost reduction since only a few cases, the ones identified by the algorithms as fraudulent, will be sent for further analysis, resulting in a cheaper and more efficient service.}
{pt=Fraude no Sistema de Saúde, Fraude, Abuso, Sistema Nacional de Saúde, Detecção de Fraude, en=Healthcare Fraud, Fraud, Abuse, National Healthcare System, Detection of Fraud}

Novembro 8, 2016, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Nuno Cavaco Gomes Horta

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar