Critérios avaliadas:
- Docker;
- SQL;
- Python;
- Organização do Código
- Documentação
- ETL
- Modelagem dos dados
- PySpark
- Esquema Estrela
- Realizar um Fork desse projeto
- Realizar a modelagem dimensional da base
- A base está disponível para download clicando aqui.
- Após descompactar a paste, o Arquivo com a base encontra-se no diretório microdados_enem_2020/DADOS/MICRODADOS_ENEM_2020.csv
- A documentação necessária sobre os campos da base está disponível nos demais diretórios dentro da pasta descompactada.
- Realizar o ETL dessa base em Python para o MySQL no container
- Disponibilizar o link do seu repositório para posterior avaliação
- Qual a escola com a maior média de notas?
- Qual o aluno com a maior média de notas e o valor dessa média?
- Qual a média geral?
- Qual o % de Ausentes?
- Qual o número total de Inscritos?
- Qual a média por disciplina?
- Qual a média por Sexo?
- Qual a média por Etnia?