
Big Data Applications
Código
200145
Unidade Orgânica
NOVA Information Management School
Créditos
7.5
Professor responsável
Língua de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Objectivos
O Big Data está em constante evolução à medida que novas tecnologias emergem e as tecnologias existentes amadurecem. Este é um curso abrangente que inclui Spark e elementos-chave do ecossistema Hadoop usados no desenvolvimento de aplicações para o processamento de dados eficiente.
Os alunos que concluírem este curso compreenderão os principais conceitos do Spark e do Hadoop e aprenderão a aplicar essas ferramentas no desenvolvimento de aplicações para resolver problemas de dados das empresas e instituições.
Pré-requisitos
Experiência de programação básica em python, bem como familiaridade básica com a linha de comandos do Linux é preferível. Conhecimentos básicos do SQL são úteis; Conhecimento do Hadoop não é necessário.
Conteúdo
CUC1.Introduction to Hadoop
- Introduction to Hadoop and the Hadoop Ecosystem
- Hadoop Architecture and HDFS
CUC2.Importing and Modeling Structured Data
- Importing Relational Data with Apache Sqoop
- Introduction to Impala and Hive
- Modeling and Managing Data with Impala and Hive
- Data Formats
- Data File Partitioning
CUC3.Ingesting Streaming Data
- Capturing Data with Apache Flume
CUC4.Distributed Data Processing with Spark
- Spark Basics
- Working with RDDs in Spark
- Aggregating Data with Pair RDDs
- Writing and Deploying Spark Applications
- Parallel Processing in Spark
- Spark RDD Persistence
- Common Patterns in Spark Data Processing
- Spark SQL and DataFrames
Bibliografia
Hadoop: The Definitive Guide. Tom White. O'Reilly 2014; Big Data Made Easy: A Working Guide to the Complete Hadoop Toolset. Michael Frampton; 0; 0; 0
Método de ensino
O curso é baseado principalmente em aulas teóricas e práticas. As sessões práticas incluem exposição de conceitos e metodologias, resolução de amostras, discussão e interpretação de resultados.
Método de avaliação
Cursos
- Pós-Graduação em Gestão dos Sistemas e Tecnologias de Informação
- Laboral - Especialização em Gestão do Conhecimento e Business Intelligence
- Pós-Graduação em Marketing Research e CRM (Estudos de Mercado e Gestão do Relacionamento com o Cliente)
- Estudos de Mercado e Gestão do Relacionamento com o Cliente
- Pós-Graduação em Gestão do Conhecimento e Business Intelligence (Inteligência de Negócio)
- Análise e Gestão de Risco
- Especialização em Gestão do Conhecimento e Business Intelligence (Inteligência de Negócio)
- Pós Graduação em Cidades Inteligentes (Smart Cities)
- Especialização em Gestão dos Sistemas e Tecnologias de Informação
- Pós-Graduação em Direção de Sistemas de Informação
- Pós-Graduação em Análise e Gestão de Risco
- Análise e Gestão de Informação
- Pós-Graduação em Sistemas de Informação Empresariais
- Pós Graduação em Digital Enterprise Management
- Pós-Graduação em Gestão de Informação e Business Intelligence na Saúde
- Pós-Graduação em Marketing Intelligence
- Especialização em Marketing Intelligence
- Pós-Graduação em Digital Marketing and Analytics