Dissertação

{pt_PT=Discourse analysis for mental health monitoring} {} EVALUATED

{pt=A detecção de demência é importante não apenas para os doentes para os quais o diagnóstico é o primeiro passo para o apoio e tratamento adequado, mas também para os investigadores, que afirmam que o diagnóstico precoce é essencial para encontrar uma cura. Deste modo, esta tese aborda o diagnóstico da demência recorrendo ao processamento de linguagem natural para a análise do discurso de doentes com possíveis sintomas desta doença. Como o discurso humano envolve processos cognitivos relacionados a subsistemas linguísticos, a sua análise é uma componente fundamental para a avaliação de um potencial declínio da saúde mental do doente. Três abordagens usando diferentes técnicas foram experimentadas nesta tese para diagnosticar automaticamente demência recorrendo a transcrições de descrições de uma imagem. Usando uma abordagem \textit{Bag-of-Words}, em combinação com um teste estatístico para a seleção de palavras, ao classificar entre doentes com Alzheimer e pessoas saudáveis, 86,1\% das transcrições foram correctamente classificadas, o que corresponde a um valor superior em 4\% relativamente ao estado da arte. A classificação entre indivíduos com demência, nas suas diferentes formas, e pessoas saudáveis é uma tarefa mais complexa do que a anterior. Mantendo esta abordagem, a percentagem de casos correctamente classificados foi semelhante ao estado da arte. Infelizmente, as outras duas abordagens, embeddings e LSTM, tiveram um pior desempenho quando comparadas com os resultados anteriores., en=Detection of dementia is important not only for patients for whom a diagnosis is the first step for appropriate support and treatment but also for researchers, who claim that early diagnosis is an important step for finding a cure. Therefore, this thesis addresses dementia diagnosis by using natural language processing for the discourse analysis of patients with possible dementia disease. Since discourse production involves cognitive processes related to linguistic subsystems and knowledge of the world, its analysis is, therefore, a fundamental component for the assessment of potential mental health decline. Three approaches using different techniques were tried in this thesis to automatically detect dementia from transcripts of an image description task. Using a bag-of-words approach, in combination with a statistic test for the word selection, we reached an accuracy of 86.1\%, which is 4\% higher than the state-of-art, when classifying between Alzheimer's patients and healthy subjects. This same proposed approach, when classifying between different dementia diseases and healthy individuals, which is typically more challenging than considering only AD, performed, in terms of accuracy score, similarly to the state-of-art that classifies between Alzheimer’s disease and control. Unfortunately, the other two approaches, an embeddings based strategy, and an LSTM Neural Network had poor performance when compared to previous work. Finally, the bag-of-words model was deployed on a Heroku server, and an Android client was built to send requests to the server and return to the user his probability to have dementia.}
{pt=Demência, Processamento Natural de Linguagem, Classificação, Bag-of-Words, en=Dementia, Natural Language Processing, Classification, Bag-of-words}

Outubro 29, 2018, 10:30

Orientação

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Alberto Abad Gareta

Departamento de Engenharia Informática (DEI)

Professor Auxiliar