Publicação em Diário da República: Plano 4 - 2010/2011
5 ECTS; 2º Ano, 2º Semestre, 30,0 PL + 30,0 TP , Cód. 925044.
Docente(s)
- Ricardo Nuno Taborda Campos (2)
(1) Docente Responsável
(2) Docente que lecciona
Pré-requisitos
Conhecimentos de C#
UC de Programação e Algoritmia; Linguagens de Programação (Desejável).
Objetivos
O aluno deverá ser capaz de desenhar a arquitetura de um motor de busca, explorar ferramentas de crawling, compreender as diferentes fases de processamento da linguagem natural, saber implementar um índice invertido, modelos de pesquisa de informação assim como a metodologia de avaliação Cranfield.
Programa
1. Introdução à pesquisa de informação e motores de busca
1.1. Definição e objetivos
1.2. Motores de busca
1.3. Aplicações
1.4. Dificuldades e desafios
1.5. Arquitetura de um sistema de pesquisa de informação
2. Crawling
2.1. Definição
2.2. Performance
2.3. Implementação
3. Processamento de texto
3.1. Sentence splitting
3.2. Tokenização
3.3. Part-of-speech
3.4. Reconhecimento de entidades
3.5. Stopwords
3.6. Stemming
4. Representação de texto
4.1. Tipos de evidência
4.2. Bag-of-words
5. Indexação
5.1. Inverted Files
5.2. Posting Lists
6. Modelos de pesquisa de informação
6.1. Booleano
6.2. Espaço vetorial
6.3. Outros modelos
7. Avaliação de sistemas de pesquisa de informação
7.1. Noção de relevância
7.2. Métodos de avaliação (laboratório, centrada no utilizador, online)
7.3. Paradigma Cranfield
7.4. Métricas de avaliação
7.5. Testes de significância
Metodologia de avaliação
- Avaliação Periódica: Frequência (60%) + Projeto I (40%)
- Avaliação Final: (em época normal e de recurso): 100%
Bibliografia
- Croft, B. e Metzler, D. e Strohman, T. (0). Search Engines: Information Retrieval in Practice. Acedido em 24 de novembro de 2015 em http://ciir.cs.umass.edu/irbook/
- Liu, B. (2007). Web Data Mining. Ams: Springer
- Manning, C. e Raghavan, P. e Schütze, H. (0). An Introduction to Information Retrieval. Acedido em 24 de novembro de 2015 em http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
- Van Rijsbergen, C. (0). Information Retrieval. Acedido em 24 de novembro de 2015 em Information Retrieval
Método de Ensino
Aulas Teórico-Práticas: Exposição dos conteúdos programáticos aos alunos com recurso ao método expositivo e demonstrativo Aulas Práticas: Análise e resolução de casos práticos
Software utilizado nas aulas
Microsoft Visual Studio