Skip to content

MATF-istrazivanje-podataka-1/2023_Data_Mining_Olimpics_Dataset

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Analiza skupa podataka Olimpijske Igre

Autor: Marko Paunović 104/2020

Olimpijske igre su jedna od najznačajnijih sportskih manifestacija na svetu, događaj koji se održava na svake 4 godine i u kojem učestvuju hiljade sportista širom sveta takmičući se za medalje u različitim sportskim disciplinama.

Cilj ovog projekta je da istražimo obrasce i trendove u istorijskim rezultatima Olimpijskih igara kako bismo bolje razumeli faktore koji su uticali na uspeh sportista tokom vremena.

Skup podataka Olympic Data možete naći na sajtu Kaggle pomoću linka: https://www.kaggle.com/datasets/bhanupratapbiswas/olympic-data

Ovaj skup sadrži podatke o takmičarima koji su se takmičili na Olimpijskim igrama u zadnjih 120 godina. Ukupno ima 70 000 takmičara koji su opisani pomoću 15 atributa. Cilj ovog projekta jeste sprovođenje detaljne analize podataka i, pomoću raznih tehnika, pravljenje optimalnih modela mašinskog učenja koji će nam pomoći da predvidimo da li će neki takmičar osvojiti medalju.

Dodatne biblioteke za rad: pandas, numpy, matplotlib, sklearn, seaborn, joblib. Možete ih instalirati pokretanjem komande u terminalu:

pip install pandas numpy matplotlib sklearn seaborn joblib

Korišćeni alogiritmi:

Klasifikacija: DecisionTreeClasifier, RandomForestClasifier, KNeighborsClasifier Klasterovanje: KMeans, BisectingKMeans, Agglomerative, DBSCAN

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published