6 ECTS; 2º Ano, 2º Semestre, 42,0 PL + 28,0 TP + 5,0 OT , Cód. 814344.
Docente(s)
- Sandra Maria Gonçalves Vilas Boas Jardim (1)(2)
(1) Docente Responsável
(2) Docente que lecciona
Pré-requisitos
Não aplicável.
Objetivos
Os estudantes que terminam com sucesso a UC de Programação para a Ciência de Dados deverão ser capazes de:
A. Proceder à aquisição de dados provenientes de diferentes fontes
B. Aplicar técnicas de limpeza, transformação e preparação de dados
C. Desenvolver código estruturado para manipulação e análise exploratória de dados
D. Implementar técnicas de engenharia de atributos
E. Produzir visualizações adequadas para análise e comunicação de resultados
F. Preparar conjuntos de dados adequados para modelação em Aprendizagem Automática
Programa
1. Introdução à Ciência de Dados e Ambiente de Trabalho
1.1 Ecossistema da Ciência de Dados
1.2 Ambientes de desenvolvimento
1.3 Bibliotecas fundamentais
2. Aquisição e Integração de Dados
2.1 Leitura de dados estruturados e semi-estruturados
2.2 Extração de dados via APIs
2.3 Introdução a bases de dados relacionais
2.4 Integração de múltiplas fontes
3. Qualidade e Limpeza de Dados
3.1 Tipos de dados e consistência
3.2 Valores em falta
3.3 Deteção de outliers
3.4 Normalização e padronização
3.5 Codificação de variáveis categóricas
4. Transformação e Engenharia de Atributos
4.1 Agregação de dados
4.2 Criação de atributos derivados
4.3 Seleção de atributos
4.4 Introdução à redução de dimensionalidade (PCA perspetiva aplicada)
5. Análise Exploratória de Dados (EDA)
5.1 Estatística descritiva
5.2 Correlação e relações entre variáveis
5.3 Identificação de padrões
6. Visualização de Dados
6.1 Visualização univariada e multivariada
6.2 Boas práticas de visualização
6.3 Comunicação de resultados
7. Preparação de Dados para Modelação
7.1 Divisão treino/teste
7.2 Pipeline de preparação de dados
7.3 Exportação de datasets preparados
Metodologia de avaliação
Avaliação por Frequência - O funcionamento da UC segue o paradigma PBL. Os elementos de avaliação são: Assiduidade e empenho demonstrado na execução das tarefas em contexto de sala de aula (10%); Implementação computacional do projeto proposto (30%); Relatório detalhado do trabalho desenvolvido (20%); Teste escrito (40%). A classificação final da UC resulta da média ponderada das classificações obtidas nas componentes de avaliação definidas. Em cada um dos elementos de avaliação o aluno deverá obter uma nota mínima de 7,5 valores. O aluno obtem aprovação à UC, estando dispensado de Exame, de acordo com o disposto nos Pontos 11 e 12, do Artigo 11º, do regulamento Académico do IPT.
Trabalhadores Estudantes - A componente de avaliação que contempla a assiduidade e empenho demonstrado na execução das tarefas em contexto de sala de aula (10%) é substituída pela discussão oral do trabalho realizado, com o mesmo peso (10%).
Avaliação por Exame - prova escrita (50%) e trabalho prático (50%), sendo que o aluno deverá obter uma nota mínima de 7,5 valores em capa componente da avaliação. A classificação final da UC resulta da média ponderada das classificações obtidas nas componentes de avaliação definidas.
O aluno obtem aprovação à UC de acordo com o disposto nos Pontos 11 e 12, do Artigo 11º, do regulamento Académico do IPT.
Bibliografia
- McKinney, W. (2022). Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter. (Vol. 1). (pp. 1-544). USA: OReilly Media
- VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data. (Vol. 1). (pp. 1-548). USA: OReilly Media
Método de Ensino
- Aulas teóricas orientadas a conceitos essenciais
- Aulas teórico-práticas com resolução de exercícios
- Desenvolvimento incremental de um projeto prático
- Utilização intensiva de ambientes computacionais
- Trabalho em grupo em regime PBL
Software utilizado nas aulas
Ferramentas Open Source.
Objetivos de Desenvolvimento Sustentável

















