Disciplina

Área

Área Científica de Inteligência Artificial > Sistemas Inteligentes

Activa nos planos curriculares

MEIC-A 2021 > MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Tecnologias da Informação e Linguagem > Língua Natural

MEIC-T 2018 > MEIC-T 2018 > 2º Ciclo > Agrupamentos > Sistemas Inteligentes > Língua Natural

Min-IA 2021 > Min-IA 2021 > Língua Natural

MEIC-T 2021 > MEIC-T 2021 > 2º Ciclo > Área Principal > Agrupamentos > Inteligência Artificial > Língua Natural

MECD2019 > MECD2019 > 2º Ciclo > Opções > Língua Natural

Min-EG 2022 > Min-EG 2022 > Inteligência Artificial e Robótica > Língua Natural

MEIC-T 2015 > MEIC-T 2015 > 2º Ciclo > Agrupamentos > Tecnologia para Processamento de Informação e Linguagem > Língua Natural

MEIC-A 2015 > MEIC-A 2015 > 2º Ciclo > Agrupamentos > Tecnologia para Processamento de Informação e Linguagem > Língua Natural

MEIC-T 2006 > MEIC-T 2006 > 2º Ciclo > Áreas de Especialização Complementares > Sistemas Inteligentes > Língua Natural

MEIC-A 2006 > MEIC-A 2006 > 2º Ciclo > Área de Especialização Complementar > Sistemas Inteligentes > Língua Natural

Nível

1. 4 testes ou 1 exame: 60% (contam os 3 melhores). 2. 2 projectos: 10% cada um 3. 12 exercícios (contam os 11 melhores): 20%. Se o número de alunos o permitir, o docente pode optar por 6 exercícios (só 5 são considerados - 10%) e 1 seminário a realizar pelos alunos (10%).

Tipo

Não Estruturante

Regime

Semestral

Carga Horária

1º Semestre

3.0 h/semana

1.5 h/semana

147.0 h/semestre

Objectivos

• Conhecer os conceitos básicos, principais formalismos, técnicas e algoritmos, bases de conhecimento e corpora envolvidos na área do Processamento da Língua Natural. • Perceber quais são as grandes tarefas envolvidas no processamento de uma frase, parágrafo ou texto e entender as dificuldades de cada uma destas tarefas. • Conhecer as principais aplicações da área e ser capaz de identificar a tecnologia envolvida. • Compreender as tarefas que são realizáveis com as tecnologias atuais.

Programa

Apresentação da disciplina (1h) Introdução ao Processamento de Língua Natural (3h 30) Conceitos básicos Ambiguidade e variabilidade linguística Conhecimento envolvido Metodologia: Corpus de treino/teste, Validação cruzada, Medidas de avaliação (precisão, cobertura, etc.) Expressões regulares e autómatos (1.5h) N-Gramas (4.5 h) N-gramas como modelos de língua Markov assumption e probabilidade de um N-grama/frase Técnicas de alisamento Morfologia (9) Morfologia e transdutores Etiquetação Morfológica Baseada em regras e estocástica HMMs e algoritmo de Viterbi Sintaxe (9h) Formalismos gramaticais Gramáticas Livres de Contexto Gramáticas de dependências Gramáticas probabilísticas Análise sintáctica Análise Sintáctica com traços Análise Sintáctica Top-down e Bottom-up Chat-parsers (Earley e CKY) Análise Sintáctica Probabilística Semântica (9h) Representação de significado Semântica Lexical Papéis semânticos Desambiguação semântica Análise Semântica Análise semântica composicional Análise semântica estatística Classificadores e sua aplicação na análise semântica Aplicações (restantes aulas) Extração de Informação (reconhecimento de entidades mencionadas, etc.) Classificação de textos Sistemas de Pergunta/Resposta Sistemas de Diálogos Sistemas de Tradução Automática Processamento de Fala

Metodologia de avaliação

1. 4 testes ou 1 exame: 60% (contam os 3 melhores). 2. 2 projectos: 10% cada um 3. 12 exercícios (contam os 11 melhores): 20%. Se o número de alunos o permitir, o docente pode optar por 6 exercícios (só 5 são considerados - 10%) e 1 seminário a realizar pelos alunos (10%).

Pré-requisitos

Componente Laboratorial

Princípios Éticos

Componente de Programação e Computação

Componente de Competências Transversais

Bibliografia

Principal

Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Second Edition

Daniel Jurafsky & James H. Martin

2009

Prentice-Hall