
Data Mining
Código
400047
Unidade Orgânica
NOVA Information Management School
Créditos
7.5
Professor responsável
Língua de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Objectivos
Em termos de competências gerais a disciplina tem por objetivos estimular no aluno: • A análise e síntese; • A organização e planeamento; • A expressão escrita e oral em Português; • A resolução de problemas, parcialmente estruturados; • A capacidade de decisão; • O gosto e as competências pelo trabalho em equipa; • A capacidade para aplicar na prática conhecimento adquirido; • A capacidade para gerar novas ideias (criatividade); • Liderança; • O trabalho de forma autónoma; Em termos de conhecimentos, na conclusão do curso, o aluno deverá: • Discutir criticamente as principais noções e conceitos associados ao Data Mining; • Ser capaz de proceder a tarefas básicas de exploração de dados, recorrendo a técnicas gráficas e indicadores numéricos; • Ser capaz de proceder a tarefas básicas de preparação e pré-processamento de dados (e.g. identificação de outliers ou substituição de valores omissos); • Ser capaz de descrever em detalhe os algoritmos: k-means e self-organizing map; • Organizar e implementar a segmentação de uma base de dados; • Ser capaz de descrever o funcionamento dos algoritmos que servem de base à construção de regras de associação; • Ser capaz de descrever o funcionamento dos algoritmos de indução de árvores de decisão; • Ser capaz de descrever o funcionamento das redes perceptrão multicamada com treino por retropropagação; • Conceber, implementar e avaliar a qualidade de um modelo preditivo para atribuição de propensão; • Analisar criticamente os conceitos e opções envolvidas na modelação preditiva.
Pré-requisitos
.
Conteúdo
• Introdução ao Data Mining; • Modelos preditivos e modelos descritivos; • Aprendizagem indutiva; • Metodologia do Data Mining; o O processo; o A definição do problema; o Medição da qualidade dos modelos; • Ferramentas de visualização; • Preparação e pré-processamento dos dados; • Modelos Descritivos; o Market basket analysis o Algoritmos de clustering (K-Means); o Self-Organizing Maps; • Modelos Preditivos o Classificadores simples o Introdução aos classificadores bayesianos o Classificação baseada em instâncias o Desenho de um sistema de aprendizagem; o Árvores de Classificação – DDT e Cart o Redes Neuronais – Perceptrão Multicamada com treino por Retropropagação o Tópicos Adicionais sobre Modelação Preditiva
Bibliografia
Livro da Disciplina (disponibilizado no ISEGI Online);
Berry, M.J.A. and G.S. Linoff, “Data Mining Techniques; for marketing, sales and customer support”. 1997, John Wiley & Sons.
Mitchell, T., (1997) “Machine Learning”, McGraw Hill.
Hand, D. J., Mannila, H., Smyth, P. (2001) “Principles of Data Mining (Adaptive Computation and Machine Learning)”, MIT Press.
Método de ensino
Aulas teórico/práticas e laboratórios.
Método de avaliação
Exame 65%, Projeto 35%.