Skip to content

johngodoi/covid19-statistical-analysis-clustering

Repository files navigation

covid19-statistical-analysis-clustering

No presente trabalho, como parte da Conclusão de Curso de Ciência dos Dados na PUC-Minas Virtual, pretendemos avaliar a situação da pandemia do coronavírus 2019 no Brasil e no Mundo.

Nele coletamos dados, e informações, a respeito da doença. Esses dados foram obtidos de um repositório na plataforma kaggle em que estão hospedados as informações que a Johns Hopkins estão disponibilizando.

Em cima desses dados faremos uma análise estatística descritiva desse dados e, por fim, um agrupamento dos países dado seu comportamento em relação a doença por suas taxas de mortalidade, recuperação e infecção.

As análises serão feitas usando Python e bibliotecas que auxiliarão na análise como: Pyspark, pandas, numpy, matplotlib, boker, entre outras.