Publicação em Diário da República: Despacho n.º 12419/2016 - 14/10/2016
6 ECTS; 2º Ano, 2º Semestre, 45,0 PL + 30,0 TP + 5,0 OT , Cód. 814315.
Docente(s)
(1) Docente Responsável
(2) Docente que lecciona
Pré-requisitos
Conhecimentos adquiridos nas UC de Programação e Algoritmia, Linguagens de Programação e Programação Orientada a Objetos.
Objetivos
O aluno deverá ser capaz de desenhar a arquitetura de um motor de busca, explorar ferramentas de crawling, compreender as diferentes fases de processamento da linguagem natural, saber implementar um índice invertido, modelos de pesquisa de informação assim como a metodologia de avaliação Cranfield.
Programa
1. Introdução à pesquisa de informação e motores de busca
1.1. Definição e objetivos
1.2. Motores de busca
1.3. Aplicações
1.4. Dificuldades e desafios
1.5. Arquitetura de um sistema de pesquisa de informação
2. Crawling
2.1. Definição
2.2. Performance
2.3. Implementação
3. Processamento de texto
3.1. Sentence splitting
3.2. Tokenização
3.3. Part-of-speech
3.4. Reconhecimento de entidades
3.5. Stopwords
3.6. Stemming
4. Representação de texto
4.1. Tipos de evidência
4.2. Bag-of-words
5. Indexação
5.1. Inverted Files
5.2. Posting Lists
6. Modelos de pesquisa de informação
6.1. Booleano
6.2. Espaço vetorial
6.3. Outros modelos
7. Avaliação de sistemas de pesquisa de informação
7.1. Noção de relevância
7.2. Métodos de avaliação (laboratório, centrada no utilizador, online)
7.3. Paradigma Cranfield
7.4. Métricas de avaliação
7.5. Testes de significância
Metodologia de avaliação
Avaliação periódica: Frequência (40%) + Projeto I (60%).
Avaliação Final - Época normal: Exame (40%) + Projeto I (60%).
Avaliação Final - Época de recurso: 100%.
Bibliografia
Método de Ensino
Aulas Teórico-Práticas: Exposição dos conteúdos programáticos aos alunos com recurso ao método expositivo e demonstrativo.
Aulas Práticas: Análise e resolução de casos práticos.
Software utilizado nas aulas
Code Blocks / Visual C; ferramentas de produtividade; plataforma de eLearning.