Skip to content

ThibaultLanthiez/pyspark_project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

⬅️ Retour vers le portfolio

Projet sur PySpark

L'objectif de ce projet était d'apprendre à utiliser le framework PySpark.

Pour cela, nous avions à disposition un jeu de données sur les positions (latitude/longitude) de conducteurs. De plus, nous avions un jeu de données sur certaines zones géographiques de la capitale du Pérou (Lima).

L'objectif premier objectif était de déterminer quand quelles zones étaient passés les véhicules pendant leur trajet. Il fallait établir un top 10 des zones les plus empruntées.

La seconde question était plus ouverte. Nous avons décidé de calculer la vitesse moyenne des usagers et de sortir quelques statistiques comme par exemple l'évolution de ces vitesses à travers les moments de la journée. Enfin, nous avons calculé la zone ou les usagers vont le plus vite.

Code

Voici le code du projet : notebook

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published