Faculdade de Ciências e Tecnologia

Knowledge Discovery

Código

10287

Unidade Orgânica

Faculdade de Ciências e Tecnologia

Departamento

Departamento de Engenharia Electrotécnica

Créditos

6.0

Professor responsável

Pedro Alexandre da Costa Sousa

Horas semanais

4

Total de horas

56

Língua de ensino

Português

Objectivos

Saber:
 Knowledge Discovery
 Datamining
 ETL
 Datawarehouse
Fazer:
 Especificação de algoritmos.
 Especificação, Desenvolvimento de técnicas de datamining
Não Técnicas:
 Capacidade de comunicação oral e escrita
 Realização de uma demonstração
 Relatório da análise, desenho e implementação de uma solução
 Organização de trabalho, gestão do tempo e cumprimento de prazos
 Trabalho e colaboração em equipa
 Capacidade de investigação e autonomia

Pré-requisitos

Inexistentes.

Conteúdo

Introdução
• Inteligência de negócio
• Sistemas Inteligentes
• Data «warehouse»
• Exploração de dados
Gestão de projectos de exploração de dados
• Gestão de projectos
• Metodologias para projectos de Exploração de dados
• Exemplos de metodologias aplicadas ao negócio (CRISP-DM, SEMMA)
Exploração de dados
• Tipos de problemas de exploração de dados
• Técnicas e aplicabilidade
• Dados de entrada e de saída
• Pré-processamento dos dados
• Qualidade dos dados
• Qualidade dos resultados
Aprendizagem
• Classificação/regressão

Tipos de aproximação ao problema

Aproximação estatística

Árvores de decisão
Regras de classificação
Aprendizagem baseada em instâncias
Estimativa do erro

• Segmentação

Tipos de aproximação ao problema
Segmentação K-means
Segmentação hierárquica (COBWEB)
• Associação
Tipos de aproximação ao problema
Regras de Associação.
Algoritmo APRIORI
Temas de discussão
• Normalização das técnicas/metodologias em Exploração dos dados
• Ética e privacidade na Exploração dos dados e conhecimento

Bibliografia

Data Mining de Eibe Frank, Christopher Pal, Mark Hall e Ian H. Witten
ISBN: 9780128042915, Edição ou reimpressão: 11-2016 Editor: ELSEVIER SCIENCE & TECHNOLOGY

Advances In Knowledge Discovery And Data Mining de Padhraic Smyth, Ramasamy Uthurusamy, Gregory Piatetsky-Shapiro e Usama M. Fayyad  ISBN: 9780262560979Edição ou reimpressão: 03-1996Editor: MIT PRESS LTD

Método de ensino

A disciplina encontra-se dividida em aulas teóricas e teórico-práticas.
Nas teórico os assuntos são abordados e introduzem-se problemas que os alunos têm de resolver e que são a base para o trabalho que implementarão na prática respectiva.
Nas aulas teórico-práticas a execução dos problemas (implementação) é efectuada.
Todos os trabalhos que os alunos desenvolvem na prática fazem parte de um trabalho de maior dimensão (integração) que os alunos têm de entregar em prazos definidos, juntamente com um relatório de análise, desenho e implementação.

Método de avaliação

Componente teórica (peso de 34%) - NT:
=========================================
Pode ser realizada através de 1 teste ou exame;
 É necessário ter nota (de exame ou média dos testes) não inferior a 9.5 valores.

Componente teórico-prática (peso de 66%) - NTP:
========================================
2  Trabalho. Entrega através do Moodle. Avaliação com base nas funcionalidades implementadas.
É necessário ter nota média não inferior a 9.5 valores.

NOTA: aprovações dos dois semestres anteriores podem ser usadas este semestre.

Cálculo da Nota Final - NF:
====================
NF = 34%*NT + 66%*NTP

Cursos