Dissertação

{en_GB=NLP Applied To Portuguese Consumer Law - Applying NLP Techniques to the Search of Portuguese Consumer Law} {} EVALUATED

{pt=Enquanto cidadãos, todos nós temos o dever de estar informados acerca dos nossos direitos e obrigações, especialmente num contexto do quotidiano, em que passamos por consumidores. Neste momento, a lei portuguesa do consumidor não é acessível ao ponto de ser possível fazer uma pesquisa num motor de busca a partir de uma frase em língua natural e saber imediatamente a resposta sem ter primeiro de percorrer vários resultados de pesquisa. O problema está no motor de busca do Diário da República Eletrónico (DRE). Neste momento, é usado um algoritmo de pesquisa de termos literais, mas o problema surge quando o sistema não consegue encontrar a resposta a uma query, porque a resposta inclui jargão jurídico que o utilizador não entende e não usa para fazer a pesquisa. Por forma a resolver este problema, introduzimos o Legal Semantic Search Engine (LeSSE), um sistema baseado no sistema Quin criado por Samarinas et al. O LeSSE usa um algoritmo de recuperação de informação tradicional (BM25) em conjunto com o BERT de forma a auxiliar na pesquisa tradicional ao derivar e usar o valor semântico de uma query para fazer uma procura no corpus. Ao usar a semântica de uma query e do corpus, conseguimos criar uma ligação entre palavras e expressões sinónimas com diferentes grafias., en=As citizens, each and every one of us should know their rights and obligations, especially in a day to day context such as when we pose as a consumer. As of yet, the Portuguese Consumer law is not accessible to the point of being able to insert a sentence written in natural language in a search engine and getting a clear response without first having to scroll through multiple search results. The issue lies in the way that the Diário da República Eletrónico (DRE) search engine works. Right now, it performs a word matching algorithm but the problem appears when the system cannot find the answer to a query when it has juridical jargon that the user does not understand and does not use to search. To solve this issue, we introduce Legal Semantic Search Engine (LeSSE), an information retrieval system based on the Quin system created by Samarinas et al. LeSSE uses a traditional information retrieval algorithm (BM25) along with BERT to derive and use the semantic value of a query to search the corpus. By using the semantics of the query and the corpus, we are able to create a connection between synonymous words and expressions with different spelling.}
{pt=Recuperação de Informação, Processamento de Língua Natural, Inteligência Artificial, Rede Neuronal, Domínio Legal, Lei do Consumidor em Portugal, en=Information Retrieval, Natural Language Processing, Artificial Intelligence, Neural Network, Legal Domain, Portuguese Consumer Law}

junho 23, 2022, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pedro Alexandre Simões dos Santos

Departamento de Matemática (DM)

Professor Associado

ORIENTADOR

João Miguel De Sousa de Assis Dias

Universidade do Algarve

Professor Auxiliar