
Data Mining
Código
100031
Unidade Orgânica
NOVA Information Management School
Créditos
6.0
Professor responsável
Roberto André Pereira Henriques
Língua de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Objectivos
Na conclusão do curso o aluno deverá:
- Discutir criticamente as principais noções e conceitos associados ao Data Mining;
- Evidenciar espírito crítico e capacidade de selecção das técnicas de preparação e pré-processamento de dados;
- Discutir o funcionamento, potencialidades e limitações das ferramentas estudadas (k-means, self-organizing maps, market basket analysis, árvores de decisão e perceptrão multi-camada);
- Evidenciar autonomia na busca e síntese de informação sobre os conceitos técnicos abordados durante a unidade curricular;
- Desenvolver autonomamente um projecto de segmentação de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
- Desenvolver autonomamente um projecto de scoring de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
- Desenvolver competências na comunicação escrita e oral de resultados.
Pré-requisitos
Não existem requisitos de frequência.
Conteúdo
- Introduction to Data Mining;
- Predictive and descriptive models;
- Inductive learning;
- Data Mining Methodology
- The process;
- The definition of the problem;
- the quality measurement;
- Data exploration;
- Visualization tools;
- Data pre-processing;
- Descriptive Models;
- Market basket analysis
- RFM Analysis;
- clustering algorithms
- K-Means;
- Self-Organizing Maps;
- Additional topics on the segmentation;
- Predictive Models
- Simple classifiers
- the Introduction to Bayesian classifiers
- Instance based classifiers
- Classification Trees - DDT, Cart and C 4.5
- Neural Networks - MLP
- Additional Topics on Predictive Modelling
Bibliografia
- Dean Abbott (2014) “Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst”, Wiley
- Daniel T. Larose, Chantal D. Larose (2015) “Data Mining and Predictive Analytics”, 2nd Edition, Wiley
- Mitchell, T., (1997) “Machine Learning”, McGraw Hill.
- Hand, D. J., Mannila, H., Smyth, P. (2001) “Principles of Data Mining (Adaptive Computation and Machine Learning)”, MIT Press.
- Collica, R. (2011), “Customer Segmentation and Clustering Using SAS Enterprise Miner” 2nd Edition, SAS Publishing
Método de ensino
A disciplina baseia-se em aulas teóricas, aulas práticas e na realização de tutoriais e exercícios. Nos tutoriais o aluno tem à sua disposição um ¿script¿ que lhe permite resolver o problema proposto, no caso dos exercícios é testada a autonomia do aluno.
Método de avaliação
1st term
- Exam (65%)
- Project 1 (15%)
- Project 2 (15%)
- 1 Practical handout (5%)
2nd term
- Exam (70%)
- Project 1 (15%)
- Project 2 (15%)