NOVA Information Management School

Data Mining

Código

100031

Unidade Orgânica

NOVA Information Management School

Créditos

6.0

Professor responsável

Roberto André Pereira Henriques

Língua de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Objectivos

Na conclusão do curso o aluno deverá:

  • Discutir criticamente as principais noções e conceitos associados ao Data Mining;
  • Evidenciar espírito crítico e capacidade de selecção das técnicas de preparação e pré-processamento de dados;
  • Discutir o funcionamento, potencialidades e limitações das ferramentas estudadas (k-means, self-organizing maps, market basket analysis, árvores de decisão e perceptrão multi-camada);
  • Evidenciar autonomia na busca e síntese de informação sobre os conceitos técnicos abordados durante a unidade curricular;
  • Desenvolver autonomamente um projecto de segmentação de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
  • Desenvolver autonomamente um projecto de scoring de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
  • Desenvolver competências na comunicação escrita e oral de resultados.

Pré-requisitos

Não existem requisitos de frequência.

Conteúdo

  • Introduction to Data Mining;
  • Predictive and descriptive models;
  • Inductive learning;
  • Data Mining Methodology
    • The process;
    • The definition of the problem;
    • the quality measurement;
  • Data exploration;
  • Visualization tools;
  • Data pre-processing;
  • Descriptive Models;
    • Market basket analysis
    • RFM Analysis;
    • clustering algorithms
      • K-Means;
      • Self-Organizing Maps;
      • Additional topics on the segmentation;
  • Predictive Models
    • Simple classifiers
    • the Introduction to Bayesian classifiers
    • Instance based classifiers
    • Classification Trees - DDT, Cart and C 4.5
    • Neural Networks - MLP
  • Additional Topics on Predictive Modelling

Bibliografia

  • Dean Abbott (2014) “Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst”, Wiley
  • Daniel T. Larose, Chantal D. Larose (2015) “Data Mining and Predictive Analytics”, 2nd Edition, Wiley
  • Mitchell, T., (1997) “Machine Learning”, McGraw Hill.
  • Hand, D. J., Mannila, H., Smyth, P. (2001) “Principles of Data Mining (Adaptive Computation and Machine Learning)”, MIT Press.
  • Collica, R. (2011), “Customer Segmentation and Clustering Using SAS Enterprise Miner” 2nd Edition, SAS Publishing

Método de ensino

A disciplina baseia-se em aulas teóricas, aulas práticas e na realização de tutoriais e exercícios. Nos tutoriais o aluno tem à sua disposição um ¿script¿ que lhe permite resolver o problema proposto, no caso dos exercícios é testada a autonomia do aluno.

Método de avaliação

1st term

  • Exam (65%)
  • Project 1 (15%)
  • Project 2 (15%)
  • 1 Practical handout (5%)

2nd term

  • Exam (70%)
  • Project 1 (15%)
  • Project 2 (15%)

Cursos