Skip to content

Commit

Permalink
traduction anglais/francais
Browse files Browse the repository at this point in the history
  • Loading branch information
Ewann35 committed Apr 10, 2024
1 parent 54f2410 commit 3fd847d
Show file tree
Hide file tree
Showing 4 changed files with 24 additions and 24 deletions.
4 changes: 2 additions & 2 deletions src/00 Data extraction.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -16,9 +16,9 @@
"id": "4ed56c64",
"metadata": {},
"source": [
"We collect data from Fbref and Transfermarkt using the WorldFootballR library. \n",
"Nous collectons les données de Fbref et Transfermarkt en utilisant la bibliothèque WorldFootballR. \n",
"\n",
"We collect data from 2015 to 2023 from major european first division leagues : England, Spain, Italy, Germany, France, Portugal, Scotland, Poland, Greece, Turkey, Switzerland, Netherlands, Belgium, Austria."
"Nous collectons des données de 2015 à 2023 auprès des principales ligues européennes de première division : Angleterre, Espagne, Italie, Allemagne, France, Portugal, Écosse, Pologne, Grèce, Turquie, Suisse, Pays-Bas, Belgique, Autriche."
]
},
{
Expand Down
28 changes: 14 additions & 14 deletions src/01 Preprocessing.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -642,26 +642,26 @@
"metadata": {},
"source": [
":::{caution}\n",
"Head coach appointments records, extracted from TransferMarkt, contains data related to head coach in that specific club : tenure, number of matches played, number of matches won, etc. Those datapoint goes beyond our cut-off date of 2023 end season (2024-01-14).\n",
"Les dossiers de nomination des entraîneurs, extraits de TransferMarkt, contiennent des données relatives à l’entraîneur dans ce club particulier : durée, nombre de matchs joués, nombre de matchs gagnés, etc. Ces données dépassent notre date limite de fin de saison 2023 (2024-01-14).\n",
"\n",
"One important thing is that those feature beyond cut-off date still relate to a head coach appointment we have in our records. This guarantees us that metrics such *number of club head coach managed* are properly reflected and still relate to head coach performance. \n",
"Une chose importante est que ces caractéristiques au-delà de la date limite sont toujours liées à une nomination d’entraîneur que nous avons dans nos dossiers. Cela nous garantit que les indicateurs tels que *nombre d’entraîneurs de club gérés* sont correctement reflétés et toujours liés à la performance des entraîneurs. \n",
"\n",
"However, this create an asymetry in our data, as certain data point are limited by a time-frame and others not.\n",
"Moreover, we must be careful in how we compare these datapoint to others dataset such as match results as it could easily bias our statistical study.\n",
"Cependant, cela crée une asymétrie dans nos données, car certains points de données sont limités par une période et d’autres non.\n",
"De plus, nous devons être prudents dans la façon dont nous comparons ces points de données à d’autres ensembles de données, comme les résultats de correspondance, car cela pourrait facilement biaiser notre étude statistique.\n",
"\n",
"The only way we combine this dataset to match result is by extracting head coach tenure on day of a match. This does not bias our statistical study as it is a feature that is properly reflected by our cut-off date.\n",
"La seule façon de combiner ce jeu de données pour obtenir le résultat est d’extraire le titre d’entraîneur le jour d’un match. Cela ne biaise pas notre étude statistique car il s’agit d’une caractéristique qui est correctement reflétée par notre date limite.\n",
":::\n",
"\n",
":::{note}\n",
"I have considered computing Head Coach performance metric from match results but we would lose information on prior records as well as creating imbalance data for plot such as linear regression of head coach performance over head coach tenure : a long standing coach which would not been dismissed soon after our start date would have a lower number of matches, thus a performance metric with higher variance that would bias linear regression due to long tenure.\n",
"nous avons envisagé de calculer la mesure du rendement des coachs en chef à partir des résultats des matchs, mais nous perdrions de l’information sur les dossiers antérieurs et nous créerions des données de déséquilibre pour le tracé, comme une régression linéaire du rendement des coachs en chef par rapport à leur ancienneté : un entraîneur de longue date qui n’aurait pas été congédié peu de temps après notre date de début aurait un nombre inférieur de matchs, donc une mesure de performance avec une variance plus élevée qui biaiserait la régression linéaire en raison de la longue durée.\n",
":::"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"We need to ensure that data is coherent and that there is only 1 head coach at a time for a team."
"Nous devons nous assurer que les données sont cohérentes et qu’il n’y a qu’un seul entraîneur-chef à la fois pour une équipe."
]
},
{
Expand Down Expand Up @@ -1117,7 +1117,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"Next we would like to add to each head coach record the number of appointment he is completing."
"Ensuite, nous aimerions ajouter à chaque entraîneur le nombre de rendez-vous qu’il termine."
]
},
{
Expand Down Expand Up @@ -1729,9 +1729,9 @@
"label": "join_head_coach_match"
},
"source": [
"We would like to add information about how long head coach has been in charge of the team when the match was played. This will allow us to see if the head coach's tenure have any impact on the match result.\n",
"Nous aimerions ajouter des informations sur combien de temps l’entraîneur a été en charge de l’équipe lorsque le match a été joué. Cela nous permettra de voir si le poste d’entraîneur a un impact sur le résultat du match.\n",
"\n",
"However, when trying to join the two dataframes, we found that team names are not consistent between the two dataframes. We will need to fix this before we can join the two dataframes."
"Cependant, en essayant de joindre les deux dataframes, nous avons constaté que les noms d’équipe ne sont pas cohérents entre les deux dataframes. Nous devrons corriger cela avant de pouvoir joindre les deux dataframes."
]
},
{
Expand Down Expand Up @@ -1767,11 +1767,11 @@
"label": "inconsistent_team_names"
},
"source": [
"In total, match_results dataset contains {eval}`len(match_team)` teams and head_coach dataset contains {eval}`len(coach_team)` teams. However some teams name are different between the two datasets. For example 'Liverpool' in match_results is 'Liverpool FC' in head_coach. This is problematic as we will need to join data on team's columns.\n",
"Au total, match_results contient {eval}`len(match_team)`teams et head_coach contient {eval}`len(coach_team). Cependant, le nom de certaines équipes est différent entre les deux ensembles de données. Par exemple, « Liverpool » dans match_results est « Liverpool FC » dans head_coach. C’est problématique, car nous devrons joindre des données dans les colonnes de l’équipe.\n",
"\n",
"In total, there is {eval}`len(coach_team_not_in_match)` teams present in head coach records that are not in match results and {eval}`len(match_team_not_in_coach)` teams present in match results but not in head coach records.\n",
"Au total, il y a {eval}`len(coach_team_not_in_match)` des équipes présentes dans les dossiers de l’entraîneur qui ne sont pas dans les résultats du match et {eval}`len(match_team_not_in_coach)` des équipes présentes dans les résultats du match, mais pas dans les dossiers de l’entraîneur.\n",
"\n",
"We will use Levenshtein distance to find the closest team of *match_results* that match each team in head coach records. We will then manually check the results to ensure that the matches are correct."
"Nous utiliserons la distance de Levenshtein pour trouver l’équipe la plus proche de *match_results* qui correspond à chaque équipe dans les dossiers de l’entraîneur-chef. Nous vérifierons ensuite manuellement les résultats pour nous assurer que les correspondances sont correctes."
]
},
{
Expand Down Expand Up @@ -2044,7 +2044,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"We can now add head coach days in post to match results."
"Nous pouvons maintenant ajouter le nombres de jours au poste d’entraîneur avec les résultats de match."
]
},
{
Expand Down
14 changes: 7 additions & 7 deletions src/02 Exploratory data analysis.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -191,14 +191,14 @@
"label": "match_data_summary"
},
"source": [
"We collected matches results and head coach records from Men's Football First Divisions during {eval}`min_season` - {eval}`max_season` seasons for the following leagues : {eval}`n_leagues`.\n",
"Nous avons collecté les résultats des matchs et les records des entraîneurs de la première division masculine de football pendant {eval}`min_season` - {eval}`max_season` saisons pour les ligues suivantes : {eval}`n_leagues`.\n",
"\n",
"This amount to a total of {eval}`n_matches` matches across {eval}`n_teams` teams.\n",
"Out of these {eval}`n_teams` we don't have any records of head coach for {eval}`n_teams_no_coach` teams.\n",
"Ce montant correspond à un total de {eval}`n_matches` matchs across {eval}`n_teams` équipes.\n",
"sur ces {eval}`n_teams` nous n’avons pas de dossier d’entraîneur pour {eval}`n_teams_no_coach` teams.\n",
"\n",
"For certain team information about head coach is present but no throughout the study period. From match results this represent {eval}`perc_match_no_coach`% of the matches.\n",
"Pour certaines équipes, l’information sur l’entraîneur est présente, mais non tout au long de la période d’étude. D’après les résultats des matchs, cela représente {eval}`perc_match_no_coach`% de matchs.\n",
"\n",
"There is a total of {eval}`n_unique_coach` unique head coaches in the dataset and {eval}`n_unique_coach_records` records of head coach appointments."
"Il y a un total de {eval}`n_unique_coach` entraîneurs uniques dans l’ensemble de données et {eval}`n_unique_coach_records` les dossiers des rendez-vous avec l’entraîneur."
]
},
{
Expand Down Expand Up @@ -371,9 +371,9 @@
"label": "home_advantage_text"
},
"source": [
"In average, team playing at home scored {eval}`home_goals:.2f` goals while away team scored {away_goals:.2f} goals ({eval}`diff_goal_perc:.0f` % less goals).\n",
"En moyenne, l’équipe qui joue à domicile a marqué {eval}`home_goals:.2f` tandis que l’équipe à l’extérieur a marqué {away_goals:.2f} goals ({eval}`diff_goal_perc:.0f` % moins de buts).\n",
"\n",
"This resulted in {eval}`home_win*100:.0f` matches won by team playing at home vs {eval}`away_win*100:.0f` for the team playing away ({eval}`diff_win_perc:.0f` % less wins). Draw matches accounted for {eval}`home_draw:.0f` % of the matches. This effect is called home advantage."
"Il en est résulté {eval}`home_win*100:.0f` matchs gagnés par une équipe jouant à domicile vs {eval}`away_win*100:.0f` pour l’équipe qui joue à l’extérieur ({eval}`diff_win_perc:.0f` % moins de victoires). Les matchs nuls représentaient {eval}`home_draw:.0f` % des matchs. Cet effet est appelé avantage à la maison."
]
},
{
Expand Down
2 changes: 1 addition & 1 deletion src/03 Headcoach analysis.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -69,7 +69,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"We will exclude head coaches with more than 4000 days in post. There are {eval}`long_tenure` head coaches with more than 3000 days in post. This include Arsene Wenger who was in charge of Arsenal for 7046 days."
"Nous exclurons les entraîneurs-chefs qui ont plus de 4 000 jours de service après la fin de leurs fonctions. Il y a {eval}`long_tenure` entraîneurs avec plus de 3000 jours en poste. Cela inclut Arsene Wenger qui a été responsable d’Arsenal pendant 7046 jours."
]
},
{
Expand Down

0 comments on commit 3fd847d

Please sign in to comment.