Skip to content

jespimentel/noticias_mpsp

Repository files navigation

Web scraping de notícias do portal MPSP com Selenium

Na seção "Precisamos falar sobre isso" da edição de n. 10 do Informativo sobre o CSMP, de 05/05/2022, houve o questionamento sobre se não haveria uma exposição excessiva da pessoa do atual PGJ, Dr. Sarrubbo, nas publicações do portal Institucional.

Desprezando, por enquanto, as fotografias que ilustram o site, o programa recuperou as manchetes do acervo de notícias, as organizou em planilhas e constatou quantas vezes o nome do PGJ apareceu nas manchetes.

A automação foi feita com Python e Selenium. A organização dos dados foi feita com Pandas.

About

web scraping de notícias do MPSP com selenium

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published