Programa

Língua Natural

Mestrado Bolonha em Engenharia e Ciência de Dados

Mestrado Bolonha em Engenharia Informática e de Computadores - Alameda

Mestrado Bolonha em Engenharia Informática e de Computadores - Taguspark

Programa

Apresentação da disciplina (1h) Introdução ao Processamento de Língua Natural (3h 30) Conceitos básicos Ambiguidade e variabilidade linguística Conhecimento envolvido Metodologia: Corpus de treino/teste, Validação cruzada, Medidas de avaliação (precisão, cobertura, etc.) Expressões regulares e autómatos (1.5h) N-Gramas (4.5 h) N-gramas como modelos de língua Markov assumption e probabilidade de um N-grama/frase Técnicas de alisamento Morfologia (9) Morfologia e transdutores Etiquetação Morfológica Baseada em regras e estocástica HMMs e algoritmo de Viterbi Sintaxe (9h) Formalismos gramaticais Gramáticas Livres de Contexto Gramáticas de dependências Gramáticas probabilísticas Análise sintáctica Análise Sintáctica com traços Análise Sintáctica Top-down e Bottom-up Chat-parsers (Earley e CKY) Análise Sintáctica Probabilística Semântica (9h) Representação de significado Semântica Lexical Papéis semânticos Desambiguação semântica Análise Semântica Análise semântica composicional Análise semântica estatística Classificadores e sua aplicação na análise semântica Aplicações (restantes aulas) Extração de Informação (reconhecimento de entidades mencionadas, etc.) Classificação de textos Sistemas de Pergunta/Resposta Sistemas de Diálogos Sistemas de Tradução Automática Processamento de Fala