Publicação em Diário da República: Despacho n.º 11262/2016 - 19/09/2016
8 ECTS; 1º Ano, Anual, 20,0 T + 12,0 PL + 20,0 TP + 4,0 S + 32,0 OT + 10,0 O , Cód. 39323.
Docente(s)
- Vasco Renato Marques Gestosa da Silva (2)
- Célio Gonçalo Cardoso Marques (2)
- Ricardo Nuno Taborda Campos (1)(2)
(1) Docente Responsável
(2) Docente que lecciona
Pré-requisitos
Não Aplicável
Objetivos
Esta unidade curricular tem por objetivo introduzir os alunos à extração e ao processamento de informação a partir de fontes de dados estruturadas e não estruturadas e apreender os conceitos relacionados com o Business Intelligence (BI).
Ao concluir esta unidade o estudante deverá:
1. entender o que é a ciência dos dados, ter a noção das tendências atuais e conhecer as várias fases de um projeto de data science.
2. entender a importância da linguagem de programação Python no contexto da ciência dos dados;
3. compreender e saber usar ferramentas de text mining, extração de informação e processamento da linguagem natural;
4. entender a importância do Cloud Computing, as suas caraterísticas, os tipos de serviços e os modelos existentes, bem como, saber implementar soluções neste domínio;
5. saber implementar ferramentas de Web Analytics;
6. saber fazer uso de ferramentas de Business Intelligence nas redes sociais;
7. entender a importância da Competitive Intelligence nas organizações e saber implementar uma estratégia de Competitive Intelligence recorrendo a ferramentas e técnicas de análise neste domínio;
8. apreender os conceitos relacionados com o Business Intelligence (BI), nomeadamente BI, Data Warehouse, Dimensões, Factos (Medidas);
9. conhecer as fases de um processo de BI: Fontes de dados, processo ETL, Data Warehousing, procedimentos de análise;
10. adquirir conhecimentos sobre a plataforma SAP Business Objects/BI: processo de BI no em sistema SAP BO/BI;
11. obter competências na utilização de soluções de BI: realização de exercícios no SAP Lumira e no Microsoft Power BI;
12. manipular e relacionar dados para analise: Modelação de dados, criação de tabelas, relacionamento de tabelas, obtenção de dados de fontes variadas;
13. criar relatórios e dashboards para análise de dados: utilização de objetos visuais para criação de gráficos, tabelas, mapas e visualização dos dados em dispositivos móveis.
Programa
1. Introdução à Ciência dos Dados
1.1. Visão geral
1.2. Tendências atuais
1.3. Análise de dados e analítica
1.4. Competências de um cientista de dados
1.5. Arquitetura de um projeto de data science
2. Python na Ciência dos Dados
2.1. Porquê usar Python?
2.2. História do Python
2.3. Características
2.4. Vantagens
2.5. Jupyter Anaconda
3. Text Mining
3.1. Definição de Text Mining e Motivação
3.2. Aplicações e Áreas de Investigação
3.3. Workflow
3.3.1. Aquisição de dados a partir de Python
3.3.1.1. Dados estruturados vs Dados não estruturados
3.3.1.2. Aquisição de dados a partir de Ficheiros (texto, imagens, pdfs, word, html, csv, json)
3.3.1.3. Consumo de APIs
3.3.1.4. Web Scraping
3.3.1.5. Web Crawling
3.3.1.6. Arquivos da Web
3.3.2. Extração de Informação a partir de Python
3.3.2.1. Introdução ao processamento da linguagem natural (nlp)
3.3.2.2. Soluções comerciais e frameworks de NLP em Python
3.3.2.3. Pre-processamento de dados textuais (Parsing; Divisão de frases; Tokenização; Normalização; Part-of-Speech (POS), Reconhecimento de Entidades (NER); Stemming)
3.3.3. Breve introdução ao Text Analytics com Pandas Dataframes
4. Cloud Computing
4.1. Contextualização histórica
4.2. Caraterísticas
4.3 Serviços
4.4 Implementação
4.5. Modelos
5. Web Analytics
5.1. Métricas
5.2. Ferramentas
5.3. Implementação
5.4. Web Analytics 2.0
6. Business Intelligence nas redes sociais
6.1. Redes Sociais
6.2. Social Engagement e Social Marketing
6.3. Gestão de crises nas redes sociais
6.4. Business Intelligence 2.0
7. Competitive Intelligence
7.1. Categorias
7.2. Técnicas de análise
7.3. Ferramentas
7.4. Implementação
8. Conceitos de Business Intelligence(BI)
8.1. BI
8.2. Data Warehouse
8.3. Dimensão
8.4. Facto (Medida)
9. Fases de um processo de BI
9.1. Fontes de dados
9.2. Processo ETL: Extract, Transform and Load
9.3. Data Warehouse
9.4. Procedimentos de análise e criação de relatórios, tabelas e dashboards
10. SAP Business Objects/BI
10.1. Data Source
10.2. InfoObjects (IOBJ)
10.3. Advanced Data Store (ADSO)
10.4. Composite Provider
10.5. Query
10.6. BI Clients
11. Soluções de BI
11.1. SAP Lumira
11.2. Microsoft Power BI
12. Modelação de dados
12.1. Criação de tabelas
12.2. Relacionamento de tabelas
12.3. Obtenção de dados de fontes variadas
12.4. Tipos de dados
12.5. Correção de dados
13. Criação de relatórios e dashboards
13.1. Gráficos
13.2. Tabelas
13.3. Mapas
13.4. Visualização de dados em dispositivos móveis
Metodologia de avaliação
Avaliação períodica: Projeto I (5%) + Projeto II (15%) + Projeto III (20%) + Projeto IV (30%) + Frequência (30%)
Participação obrigatória em todos os elementos de avaliação com nota mínima de 7 valores (em cada um)
Avaliação Final: Exame (100%)
Bibliografia
- Beasley, M. (2013). Practical Web Analytics for User Experience: How Analytics Can Help You Understand Your Users. Waltham: Morgan Kaufmann
- Burke, C. (2014). Competitive Intelligence the Internet Way. s.l.: SB2 Group
- Mahmood, Z. e Puttini, R. e Erl , T. (2013). Cloud Computing: Concepts, Technology & Architecture. s.l.: Prentice Hall
- Provost , F. e Fawcett, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. USA: O'Reilly Media
Método de Ensino
Exposição dos conteúdos programáticos aos alunos com recurso ao método expositivo e demonstrativo. Análise e resolução de casos práticos
Software utilizado nas aulas
Jupypter Anaconda / Python
Ferramentas relacionadas com social media, Web analytics e competitive intelligence;
Moodle.
SAP
Aprovado em Conselho Técnico Cientifico: 16 de julho de 2021
Download da Ficha da Unidade Curricular (FUC)