Le fichier data.csv contient une base de données des salariés d'une entreprise : pour chacun, on dispose de :
- id
- age
- niveau d'éducation
- intitulé du métier
- nombre d'années d'expérience
- salaire
Le niveau d'éducation est codé par un entier :
valeur | niveau |
---|---|
0 | High School |
1 | Bachelor |
2 | Master |
3 | PhD |
- Donnez sous forme de camembert la répartition des genres.
- Donnez sous forme d'histogramme la répartition des niveaux d'études, suivants le genre.
- Donnez sous forme d'histogramme, les effectifs des 10 professions les plus représentées.
- Quelle est la profession la plus fréquente des femmes ? des hommes ?
- Pour chaque niveau d'études, donnez le salaire moyen, l'âge moyen et l'expérience moyenne.
- Pour chaque genre, donnez le salaire moyen, l'âge moyen et l'expérience moyenne.
- Donnez sous forme d'histogrammes la distributions des ages.
- Donnez sous forme d'histogrammes la distributions de l'expérience.
- Donnez les quartiles, interquatiles, min,max, moyenne, mediane, mode, et ecart type de l'age.
- A l'aide du paquet stixbox, tracez une boite à moustache pour l'age.
- Refaire les questions précédentes pour l'expérience.
- Donnez, sous forme d'histogramme la distribution des salaires, suivant le genre.
- Tracez un histogramme des salaires moyens suivants le niveau d'études.
- Donnez les quartiles, interquatiles, min,max, moyenne, mediane, et ecart type des salaires. Tracez une boite à moustaches.
- Refaire la question précédente, en distingant les genres. Tracez une boîte à moustache pour chaque genre. Commentaires ?
- Tracez un nuage de points (age,salaire), et la droite de regression correspondante. Quel est le coefficient de corrélation ?
- Tracez un nuage de points (expérience,salaire), et la droite de regression correspondante. Quel est le coefficient de corrélation ?
- Tracez un nuage de points (salaire,expérience) pour les hommes et les femmes, ainsi que les droites de regression associées. Commentaire ?
- Tracez un nuage de points (salaire,expérince) et les droites de regression associées pour chaque niveau d'études. Commentaire ?
- Denis MONNERAT : @monnerat