Planeamento

Aulas Laboratoriais

ALAMEDA: Aula L01: Ambiguidade sintáctica e semântica

Ambiguidade na língua natural. Motivação com exemplos. Construção informal de árvores sintáticas para frases ambíguas. Atribuição de uma semântica a cada estrutura sintática. Apresentação do problema Nº 2 (série de problemas).


ALAMEDA - Aula L02: Número mínimo de edições

Algoritmo para calcular o menor número de edições entre cadeias de caracteres. Distância de Levenshtein. Realização de dois exercícios práticos.

discussão sobre o funcionamento de um corretor ortográfico como possível utilização para o algoritmo lecionado. Outras possíveis utilizações.

Apoio à resolução do 1º mini-projeto.


ALAMEDA - Aula L03: Algoritmo de Viterbi

Motivação e apresentação do algoritmo de Viterbi. Utilização do algoritmo de Viterbi para atribuição de um etiquetas morfológicas.


ALAMEDA — Aula L04: Análise sintáctica ascendente por grafo

Utilização do algoritmo ascendente por grafo [Natural Language Understanding, J. Allen, secção 3.6] para proceder à análise sintáctica.

Aula L05: Unificação de traços

Utilização do algoritmo de unificação de estruturas de traços. Definição de Perplexidade.

ALAMEDA - Aula L06: Algoritmo de Earley (6/14)

Utilização do algoritmo de Earley (descendente por grafo) [Speech and Language Processing, Jurafsky, 13.4.2] para proceder à análise sintáctica.

ALAMEDA - Aula L07: Cálculo-Lambda (1ª parte)

Introdução ao cálculo Lambda. Variáveis livres. Substituição. Exercícios práticos.

ALAMEDA - Aula L08: Cálculo-Lambda (2ª parte)

Introdução ao cálculo Lambda. Redução beta. Exercícios práticos.

ALAMEDA - Aula L09: Análise Semântica

Exercícios de cálculo composicional da semântica de frases.

ALAMEDA - Aula L10:

Esta aula foi substituída pelo 1º teste

ALAMEDA - Aula L11:

Feriado Nacional

ALAMEDA - Aula L12:

Feriado Nacional

ALAMEDA - Aula L13:

Esta aula foi substituída pelo 4º teste

Aulas Teóricas

ALAMEDA - Aula T01: Apresentação

Estatísticas do ano lectivo anterior, bibliografia, avaliação de conhecimentos, código de conduta.

ALAMEDA - Aula T02: Introdução ao processamento de língua natural

Porquê o Processamento de Língua Natural (PLN). O processo de análise. Análise morfológica, Análise sintáctica, Análise semântica, Análise contextual. Ambiguidade. 

ALAMEDA - Aula T03: Operações com transdutores

Expressões Regulares: símbolos especiais, intervalos, determinação da quantidade. Substituição de padrões. Exemplos.

Autómatos de estados finitos. Determinismo. Transições epson. Transdutores. Exemplos.

Operações sobre transdutores na fsm tools: união, concatenação, fecho, reversal, inversão, composição, interseção e remoção de estados inacessíveis.

ALAMEDA - Aula T04: Morfologia e transdutores

Análise morfológica recorrendo a transdutores: fita léxica, fita intermédia e fita superficial. Partes de um analisador morfológico: léxico, morfotácticas e regras ortográficas. 

Definição de Morfologia, lexema, lema, afixo, prefixo, sufixo, infixo e circunfixo. Flexão por oposição a derivação.

ALAMEDA - Aula T05: Processamento estatístico da língua

Introdução ao processamento estatístico em Língua Natural. Probabilidade Condicional. N-Gramas, Modelo de Markov. Escolha de N-gramas.

Alisamento: Laplace, Good-touring, interpolação, Back-off.

ALAMEDA - Aula T06:  N-Gramas

Resolução de um problema que exige: (i) o cálculo de probabilidades associada a bigramas; (ii) o cálculo de probabilidades quando se, procede a alisamento (add-one); (iii) o cálculo das contagens equivalentes ao alisamento calculado; e (iv) cálculo da probabilidade de uma frase usando as probabilidades calculadas anteriormente.

ALAMEDA - Aula T07: Etiquetação morfológica

Introdução à etiquetação morfológica. Classes morfológicas. Dificuldades. Etiquetação morfológica baseada em regras, baseada em métodos estatísticos (modelo do canal ruidoso) e baseadas em transformações.

Corpus de treino, de desenvolvimento e de avaliação.

Avaliação: Precisão, abrangência (recall), "accuracy", medida-f.

ALAMEDA - Aula T08: Análise sintáctica

Sintaxe. Constituintes de uma frase. 

Hierarquia de Chomsky: gramáticas regulares, gramáticas livres de contexto, gramáticas sensíveis ao contexto, gramáticas tipo 0.

Análise sintática tradicional (árvores sintáticas), versus análise sintática de dependências (chunks).

Problemas da análise sintática: concordância, sub-categorização. problema da associação de sintagmas preposicionais.

Distinção entre léxico e gramática. Análise descendente pura. Exercitação do algoritmo de análise descendente pura.

ALAMEDA - Aula T09: Análise sintáctica com traços

Estruturas de traços. Unificação de estruturas de traços (introdução). Subsumpção. Incorporação de traços nas gramáticas.

Apresentação do mapa conceptual referente à matéria lecionada e em avaliação no 1º teste.

Breve apresentação do 2º Mini-projeto.

ALAMEDA - Aula T10: Algoritmo CKY

Utilização do algoritmo CKY para proceder à análise sintáctica. Exemplificação.

ALAMEDA - Aula T11: Análise sintáctica probabilística

Gramáticas livres de contexto probabilísticas. Atribuição de probabilidades a árvores de análise. Gramáticas livres de contexto lexicalizadas probabilísticas. Sub-categorização. Gramáticas de dependências. Gramáticas de categorias.

ALAMEDA - Aula T12: Sistemas reais de LN — Cadeia de processamento STRING do L2F

Apresentação do sistema STRING, uma cadeia de processamento de Língua Natural em desenvolvimento no Laboratório de Sistemas de Língua falada (L2F) do INESC-ID.

(https://string.l2f.inesc-id.pt/w/index.php/Main_Page)

ALAMEDA - Aula T13: Representação semântica

Linguagens de representação de significado: representação de significado, linguagens de representação de significado (cálculo de predicados de primeira ordem, redes semânticas, enquadramentos). Propriedades das linguagens de representação de significado: verificabilidade, não ambiguidade, forma canónica, inferência e variáveis, expressividade. Estrutura predicado-argumentos: sub-categorização dos verbos.

ALAMEDA - Aula T14: Análise semântica

Lógica de predicados: representação de eventos e tempo; aspecto.

Ambiguidade semântica: sentido, ambiguidade estrutural, ambiguidade lexical, desambiguação semântica.

Discussão informal do princípio da semântica composicional e do conceito de "expressão idiomática".

ALAMEDA - Aula T15: Semântica lexical

Semântica Lexical: lexema, léxico, sentido, forma ortográfica. Relações entre lexemas e os seus significados: Homonímia, Polissemia, Sinonímia, Hiponímia, Hiperonímia e Meronímia. Recursos léxicos disponíveis. A Wordnet. A wordnet portuguesa.

ALAMEDA - Aula T16: Desambiguação semântica

Papeis temáticos: Agente, Co-agente, Experimentador, Tema, Instrumento, Beneficiário, Força, (de/para/em)-Tempo, (de/para/em)-Local, (de/para/em)-Valor, (de/para/em)-Poss.

ALAMEDA - Aula T17: Desambiguação semântica

Introdução à desambiguação semântica. Abordagens baseadas em recursos léxicos: restrições seleccionais e baseadas em dicionários. Abordagens supervisionadas baseadas em corpora. 

Apresentação do Mapa conceptual da análise semântica.

ALAMEDA - Aula T18 - Sistemas de diálogo

Definição de Sistema de diálogo. Componentes dos sistemas de diálogo; Classificação de sistemas de diálogo; Estratégias de desambiguação; Actos de discurso; Desenho da interface. Os sistemas de diálogo no Laboratório de Sistemas de Língua Falada. O projeto Watson da IBM.

ALAMEDA - Aula T19: Sistemas reais de LN

Esta aula será lecionada por um convidado.


ALAMEDA - Aula T19: Sistemas reais de LN

Esta aula será lecionada por um convidado.

ALAMEDA - Aula T20: Sistemas reais de LN

Esta aula será lecionada por um convidado.

ALAMEDA - Aula T20: Sistemas reais de LN

Esta aula será lecionada por um convidado.


ALAMEDA - Aula T21: Sistemas reais de LN

Esta aula será lecionada por um convidado.

ALAMEDA - Aula T22: Sistemas de recuperação de informação

Necessidade de sistemas de recuperação; definição de sistemas de recuperação de informação; sistemas de extracção de informação; exemplos de sistemas de informação; arquitectura típica de um sistema de recuperação de informação; Módulos de um sistema de recuperação de informação; Modelos clássicos: booleano, vectorial, probabilístico. Termos e suas definições.

ALAMEDA - AULA T26: Conclusão/Balanço

Comentários dos alunos ao funcionamento da disciplina. Apresentação dos dados recolhidos ao longo do semestre (tempo despendido, presenças às aulas e notas obtidas).