O Curso
Objetivo
O objetivo do curso de Big Data é capacitar os participantes com conhecimentos teóricos e práticos sobre a coleta, armazenamento, processamento e análise de grandes volumes de dados, além de fornecer habilidades para extrair insights valiosos desses dados. Aqui estão alguns objetivos específicos de um curso de Big Data:
Compreensão dos Fundamentos: O curso visa fornecer uma compreensão abrangente dos fundamentos do Big Data, incluindo conceitos chave, tecnologias e arquiteturas utilizadas para lidar com conjuntos de dados massivos.
Domínio de Ferramentas e Tecnologias: Os participantes do curso aprendem a utilizar ferramentas e tecnologias específicas de Big Data e plataformas de processamento de dados em tempo real.
Desenvolvimento de Habilidades Técnicas: O curso visa desenvolver habilidades técnicas necessárias para trabalhar com Big Data, incluindo programação em linguagens como Python, manipulação de dados em ambientes distribuídos e execução de análises estatísticas avançadas.
Aplicação em Cenários do Mundo Real: Os participantes têm a oportunidade de aplicar seus conhecimentos em projetos práticos baseados em casos de uso do mundo real. Isso permite que eles ganhem experiência prática e compreendam como o Big Data é aplicado em diferentes setores e organizações.
Aprendizado de Técnicas de Análise de Dados: O curso abrange técnicas de análise de dados, como mineração de dados, aprendizado de máquina e análise preditiva. Os participantes aprendem a extrair insights significativos dos dados e a utilizar esses insights para tomar decisões informadas.
Entendimento da Importância da Governança de Dados: Os participantes aprendem sobre a importância da governança de dados e as práticas recomendadas para garantir a qualidade, segurança e conformidade dos dados em ambientes de Big Data.
De modo geral o objetivo do curso de Big Data é capacitar os participantes com conhecimentos e habilidades para lidar com os desafios e oportunidades apresentados pelo processamento e análise de grandes volumes de dados na era digital.
Depois de concluir este curso os alunos serão capazes de
- Compreender os fundamentos do Big Data;
- Dominar as principais ferramentas e tecnologias específicas de Big Data e plataformas de processamento de dados em tempo real;
- Desenvolver habilidades técnicas para trabalhar com Big Data;
- Aplicar aplicar seus conhecimentos em projetos práticos baseados em casos de uso do mundo real;
- Trabalhar técnicas de Análise de Dados, como mineração de dados, aprendizado de máquina e análise preditiva.
Pré-requisitos
- Conhecimentos em excel avançado;
- Lógica ou estrutura de tabelas.
Carga Horária
48 horas
Conteúdo programático
1. Introdução aos Fundamentos e Básicos de SQL
Conceitos Básicos
Conexões em Bancos de Dados
Consultas e Manipulações Simples de Dados
2. Introdução aos Fundamentos e Básico de Python
Conceitos Iniciais
Fundamentos, Sintaxes e Boas Práticas
Estruturas de Dados em Python
3. Fundamentos de PySpark
Conceitos do Apache Spark
DataFrames em PySpark
Configuração de Clusters
Ambiente de Desenvolvimento em PySpark
4. Desenvolvimento em PySpark
Funções de Leitura de Dados
Estruturas de Dados em PySpark
Análise Exploratória de Dados
5. Manipulação de Dados em PySpark
Técnicas Avançadas de Manipulação de Dados
Tratamento de Dados Temporais
Transformações de Dados
Agrupamento de Dados
6. Gestão de Pipelines
Estruturas de Dados Otimizadas
Conceitos e Práticas de Particionamento
Desenvolvimento de Pipelines de Dados
programático
Próximas turmas