Disciplina

Área

Área Científica de Inteligência Artificial > Sistemas Inteligentes

Activa nos planos curriculares

MEIC-A 2021 > MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Sistemas de Informação > Processamento e Recuperação de Informação

METI 2018 > METI 2018 > 2º Ciclo > Áreas de Especialização > Gestão das Redes, da Informação e dos Serviços > Processamento e Recuperação de Informação

MEIC-T 2018 > MEIC-T 2018 > 2º Ciclo > Agrupamentos > Tecnologias da Informação e Linguagem > Processamento e Recuperação de Informação

MEIC-A 2018 > MEIC-A 2018 > 2º Ciclo > Agrupamentos > Tecnologias da Informação e Linguagem > Processamento e Recuperação de Informação

METI 2021 > METI 2021 > 2º Ciclo > Área Principal > Especializações > Especialização em Ciência de Dados para a Web > Informática > Processamento e Recuperação de Informação

MEIC-T 2021 > MEIC-T 2021 > 2º Ciclo > Área Principal > Agrupamentos > Tecnologias da Informação e Linguagem > Processamento e Recuperação de Informação

MECD2019 > MECD2019 > 2º Ciclo > Opções > Processamento e Recuperação de Informação

MEIC-T 2015 > MEIC-T 2015 > 2º Ciclo > Agrupamentos > Tecnologia para Processamento de Informação e Linguagem > Processamento e Recuperação de Informação

MERC 2006 > MERC 2006 > 2º Ciclo > Tronco Comum > Processamento e Recuperação de Informação

MEIC-A 2015 > MEIC-A 2015 > 2º Ciclo > Agrupamentos > Tecnologia para Processamento de Informação e Linguagem > Processamento e Recuperação de Informação

MEIC-A 2006 > MEIC-A 2006 > 2º Ciclo > Área Aplicacional > Informação e Conhecimento > Processamento e Recuperação de Informação

Nível

40% Projeto (P) com 2 entregas (P1, P2) + 60% Exame final (E) Nota final: 0.2xP1 + 0.2xP2 + 0.6xE Nota mínima: 9,5 valores para a média do projeto (P) e 9,5 valores para o exame (E) Trabalhador-estudante (reconhecido): tem de desenvolver o projeto, pode optar o fazer individualmente

Tipo

Não Estruturante

Regime

Semestral

Carga Horária

1º Semestre

2.0 h/semana

1.5 h/semana

119.0 h/semestre

Objectivos

A disciplina visa proporcionar uma introdução aos conceitos-chave, tecnologias, e mecanismos de processamento de dados utilizados nas áreas da Recuperação, Filtragem e Extração de Informação. Os alunos da disciplina aprenderão os conceitos teóricos fundamentais nestas áreas, adquirindo as competências teóricas e práticas necessárias para: 1. Projetar soluções modernas para o processamento, gestão e interrogação de grandes volumes de informação; 2. Classificar e agrupar automaticamente conjuntos de recursos (e.g., grandes conjuntos de documentos de texto) através de características descritivas; 3. Conceber sistemas para a recuperação e filtragem da informação relevante existente em grandes coleções, com base em termos chave, com base em exemplos, ou com base em perfis dos utilizadores; 4. Conceber sistemas para a extração de informação 5. Avaliar comparativamente diferentes sistemas da Recuperação, Filtragem e Extração de Informação.

Programa

Introdução à extração e recuperação de informação Modelos para dados não estruturados Processamento de Informação não estruturada e extração de informação a partir de texto Avaliação em recuperação e extração de informação Modelos de dados semi-estruturados Processamento de informação semi-estruturada e extração de dados da Web Análise de hiperligações e recuperação de informação na Web Indexação e consulta de informação não estruturada Pesquisa por itens similares e pesquisa por similaridade em dados multi-dimensionais Sistemas de recomendação Técnicas de processamento distribuído para IR e IE Aplicações: Enterprise search e pesquisa de peritos, Bibliotecas digitais, Prospecção de opiniões em conteúdos online, publicidade online

Metodologia de avaliação

40% Projeto (P) com 2 entregas (P1, P2) + 60% Exame final (E) Nota final: 0.2xP1 + 0.2xP2 + 0.6xE Nota mínima: 9,5 valores para a média do projeto (P) e 9,5 valores para o exame (E) Trabalhador-estudante (reconhecido): tem de desenvolver o projeto, pode optar o fazer individualmente

Pré-requisitos

Os estudantes devem ser proeficientes em programação e dominar os conceitos básicos de probabilidades e estatística

Componente Laboratorial

Desenvolvimento de projecto de um sistema de recuperação de informação, a partir de guiões de laboratório com exemplos práticos. Os alunos trabalham em grupos de três na concepção da solução para o projecto.

Princípios Éticos

Todos os membros de um grupo são responsáveis pelo trabalho do grupo. Em qualquer avaliação, todo aluno deve divulgar honestamente qualquer ajuda recebida e fontes usadas. Numa avaliação oral, todo aluno deverá ser capaz de apresentar e responder a perguntas sobre toda a avaliação.

Componente de Programação e Computação

N/A

Componente de Competências Transversais

Em termos de Competências Interpessoais e Literacia da Informação e dos Media, o curso endereça os tópicos de Comunicação Escrita e de Estruturação e Formação de Relatórios, respetivamente, através da avaliação do relatório produzido no âmbito do projeto. Quanto a Competências Intrapessoais, são tratados os aspetos relacionados com a Produtividade e Gestão do Tempo (definição do planeamento do projeto e respetiva verificação) e de Tomada de Decisão (discussão das decisões tomadas no projeto, e pela justificação face às alternativas).

Bibliografia

Principal

Modern Information Retrieval, the concepts and technology behind search - 2nd edition

Ricardo Baeza-Yates and Berthier Ribeiro-Neto

2011

Addison-Wesley Professional


Web Data Mining: Exploring Hyperlinks, Contents and Usage Data - 2nd edition

Bing Liu

2011

Springer