Informática e Tecnologias Multimédia

Programação para a Ciência de Dados

<< voltar ao Plano Curricular

6 ECTS; 2º Ano, 2º Semestre, 42,0 PL + 28,0 TP + 5,0 OT , Cód. 814344.

Docente(s)
- Sandra Maria Gonçalves Vilas Boas Jardim (1)(2)

(1) Docente Responsável
(2) Docente que lecciona

Pré-requisitos
Não aplicável.

Objetivos
Os estudantes que terminam com sucesso a UC de Programação para a Ciência de Dados deverão ser capazes de:

A. Proceder à aquisição de dados provenientes de diferentes fontes
B. Aplicar técnicas de limpeza, transformação e preparação de dados
C. Desenvolver código estruturado para manipulação e análise exploratória de dados
D. Implementar técnicas de engenharia de atributos
E. Produzir visualizações adequadas para análise e comunicação de resultados
F. Preparar conjuntos de dados adequados para modelação em Aprendizagem Automática

Programa
1. Introdução à Ciência de Dados e Ambiente de Trabalho
1.1 Ecossistema da Ciência de Dados
1.2 Ambientes de desenvolvimento
1.3 Bibliotecas fundamentais

2. Aquisição e Integração de Dados
2.1 Leitura de dados estruturados e semi-estruturados
2.2 Extração de dados via APIs
2.3 Introdução a bases de dados relacionais
2.4 Integração de múltiplas fontes

3. Qualidade e Limpeza de Dados
3.1 Tipos de dados e consistência
3.2 Valores em falta
3.3 Deteção de outliers
3.4 Normalização e padronização
3.5 Codificação de variáveis categóricas

4. Transformação e Engenharia de Atributos
4.1 Agregação de dados
4.2 Criação de atributos derivados
4.3 Seleção de atributos
4.4 Introdução à redução de dimensionalidade (PCA – perspetiva aplicada)

5. Análise Exploratória de Dados (EDA)
5.1 Estatística descritiva
5.2 Correlação e relações entre variáveis
5.3 Identificação de padrões

6. Visualização de Dados
6.1 Visualização univariada e multivariada
6.2 Boas práticas de visualização
6.3 Comunicação de resultados

7. Preparação de Dados para Modelação
7.1 Divisão treino/teste
7.2 Pipeline de preparação de dados
7.3 Exportação de datasets preparados

Metodologia de avaliação
Avaliação por Frequência - O funcionamento da UC segue o paradigma PBL. Os elementos de avaliação são: Assiduidade e empenho demonstrado na execução das tarefas em contexto de sala de aula (10%); Implementação computacional do projeto proposto (30%); Relatório detalhado do trabalho desenvolvido (20%); Teste escrito (40%). A classificação final da UC resulta da média ponderada das classificações obtidas nas componentes de avaliação definidas. Em cada um dos elementos de avaliação o aluno deverá obter uma nota mínima de 7,5 valores. O aluno obtem aprovação à UC, estando dispensado de Exame, de acordo com o disposto nos Pontos 11 e 12, do Artigo 11º, do regulamento Académico do IPT.

Trabalhadores Estudantes - A componente de avaliação que contempla a assiduidade e empenho demonstrado na execução das tarefas em contexto de sala de aula (10%) é substituída pela discussão oral do trabalho realizado, com o mesmo peso (10%).

Avaliação por Exame - prova escrita (50%) e trabalho prático (50%), sendo que o aluno deverá obter uma nota mínima de 7,5 valores em capa componente da avaliação. A classificação final da UC resulta da média ponderada das classificações obtidas nas componentes de avaliação definidas.
O aluno obtem aprovação à UC de acordo com o disposto nos Pontos 11 e 12, do Artigo 11º, do regulamento Académico do IPT.

Bibliografia
- McKinney, W. (2022). Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter. (Vol. 1). (pp. 1-544). USA: O’Reilly Media
- VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data. (Vol. 1). (pp. 1-548). USA: O’Reilly Media

Método de Ensino
- Aulas teóricas orientadas a conceitos essenciais
- Aulas teórico-práticas com resolução de exercícios
- Desenvolvimento incremental de um projeto prático
- Utilização intensiva de ambientes computacionais
- Trabalho em grupo em regime PBL

Software utilizado nas aulas
Ferramentas Open Source.

 

 

Objetivos de Desenvolvimento Sustentável

Garantir o acesso à educação inclusiva, de qualidade e equitativa, e promover oportunidades de aprendizagem ao longo da vida para todos
Construir infraestruturas resilientes, promover a industrialização inclusiva e sustentável e fomentar a inovação
Reforçar os meios de implementação e revitalizar a parceria global para o desenvolvimento sustentável

 


<< voltar ao Plano Curricular
ISO 9001
NP4552
SGC
KreativEu
erasmus
catedra
b-on
portugal2020
centro2020
compete2020
crusoe
fct
feder
fse
poch
portugal2030
poseur
prr
santander
republica
UE next generation
Centro 2030
Lisboa 2020
Compete 2030
co-financiado