Web Scraping

O web scraping (raspagem de rede, em tradução livre), também conhecido como extração de dados da web, é o nome dado ao processo de coleta de dados estruturados da web de maneira automatizada. Em geral, esse método é usado por pessoas, empresas que desejam usar a vasta quantidade de dados da web disponíveis publicamente para tomar decisões mais inteligentes.

O desafio

Fazer um web scraping da tabela de dados do Portal da Transparência do Governo Federal
armazenar num banco de dados relacional
fornecer um endpoint (/api/dados) que retorne um json com os dados coletados:
- Estrutura do retorno da API:
  - mes_ano
  - programa_orcamentario
  - acao_orcamentaria
  - valor_empenhado
  - valor_liquidado
  - valor_pago
  - valor_restos_a_pagar_pagos

Bônus: Fazer o scraping de todas as páginas da tabela do site

A tabela de dados para o scraping fica em (ver print abaixo):

https://www.transparencia.gov.br/despesas/orgao?ordenarPor=orgaoSuperior&direcao=asc

Sugestões

Preferencialmente utilize PHP, mas esteja livre para usar qualquer linguagem
Sugerimos usar docker para facilitar o desenvolvimento e a avaliação do resultado
Faça um segundo README com o nome PROJETO.md explicando o que foi feito, como forma de documentação.
Diferenciais:
- Boa documentação
- Testes unitários modulares

Como você deve nos enviar sua solução?

Faça um clone deste projeto, crie uma branch com seu nome-sobrenome e ao finalizar abra um pull-request para que um avaliador da agilize possa visualizar e envie um e-mail para dev@agilize.com.br com o assunto: [DESAFIO BACKEND AGZ] + Finalizado + (nome-da-branch)

Como abrir um pull request

Passo 1: Fazer um fork do projeto
Passo 2: Clonar seu fork para o seu computador
Passo 3: Fazer o projeto em sua branch
Passo 4: Abrir o pull request

Para mais detalhes esse link tem uma explicação bastante completa

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Web Scraping

O desafio

Sugestões

Como você deve nos enviar sua solução?

Como abrir um pull request

About

Releases

Packages

License

agilize/backend-challenge

Folders and files

Latest commit

History

Repository files navigation

Web Scraping

O desafio

Sugestões

Como você deve nos enviar sua solução?

Como abrir um pull request

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages