Skip to content

Commit

Permalink
embeded data presentation
Browse files Browse the repository at this point in the history
  • Loading branch information
mathisdrn committed Apr 8, 2024
1 parent d3e2061 commit 339fe7b
Show file tree
Hide file tree
Showing 3 changed files with 29 additions and 12 deletions.
15 changes: 10 additions & 5 deletions Paper.md
Original file line number Diff line number Diff line change
Expand Up @@ -101,11 +101,6 @@ year <- c(2018, 2019, 2020, 2021, 2022)
```
## Présentation des données extraites

% ne pas rajouter + de choses à cette section
% il doit être possible de réutiliser directement les cellules markdown des notebook qui contiennent les {eval}

Nous avons récupéré...

### Données des coachs

Les données des coachs sont extraites de Fbref. Elles contiennent des informations sur les coachs de football, notamment leur nom, leur date de naissance, leur nationalité, les clubs pour lesquels ils ont travaillé, les dates de début et de fin de leur mandat, ainsi que des statistiques sur les matchs qu'ils ont dirigés.
Expand All @@ -115,6 +110,11 @@ Les données des coachs sont extraites de Fbref. Elles contiennent des informati
![](#head_coach)
:::

% continuer la présentation sur la cellule correspondante dans le notebook

```{embed} #hc_data_presentation
```

### Données sur les matchs

Les données sur les matchs sont extraites de Transfermakt. Elles contiennent des informations sur les matchs de football, notamment les équipes qui ont joué, le score final, le lieu du match, la date du match.
Expand All @@ -124,6 +124,11 @@ Les données sur les matchs sont extraites de Transfermakt. Elles contiennent de
![](#match_results)
:::

% continuer la présentation sur la cellule correspondante dans le notebook

```{embed} #match_data_presentation
```

## Pré-traitement des données

Utilisation de l'algorithme de la distance Levenshtein [@Levenshtein1965BinaryCC] pour matcher les noms des clubs entre les deux jeux de données
Expand Down
16 changes: 11 additions & 5 deletions src/02 Headcoach analysis.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -63,9 +63,18 @@
"head_coach = pd.read_csv('data/head_coach.csv', parse_dates=['appointed', 'end_date'])"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### General information about data"
]
},
{
"cell_type": "markdown",
"metadata": {
"label": "hc_data_presentation",
"tags": [],
"user_expressions": [
{
"expression": "min_year.strftime(\"%m/%d/%Y\")",
Expand Down Expand Up @@ -110,11 +119,8 @@
]
},
"source": [
"### General information about data\n",
"\n",
"Data collected from match results ranges from {eval}`min_year.strftime(\"%m/%d/%Y\")` to {eval}`max_year.strftime(\"%m/%d/%Y\")` and contains the results of {eval}`len(match_results)` matches.\n",
"\n",
"Matches have been collected for the following leagues : **{eval}`\", \".join(match_results['league'].unique().tolist())`**"
"Les données sur les coachs contiennent {eval}`head_coaches.shape[0]` enregistrement de coachs. \n",
"À continuer..."
]
},
{
Expand Down
10 changes: 8 additions & 2 deletions src/03 Match results analysis.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -192,9 +192,17 @@
"max_year = match_results['date'].max()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### General information about data"
]
},
{
"cell_type": "markdown",
"metadata": {
"label": "match_data_presentation",
"user_expressions": [
{
"expression": "min_year.strftime(\"%m/%d/%Y\")",
Expand Down Expand Up @@ -239,8 +247,6 @@
]
},
"source": [
"### General information about data\n",
"\n",
"Data collected from match results ranges from {eval}`min_year.strftime(\"%m/%d/%Y\")` to {eval}`max_year.strftime(\"%m/%d/%Y\")` and contains the results of {eval}`len(match_results)` matches.\n",
"\n",
"Matches have been collected for the following leagues : **{eval}`\", \".join(match_results['league'].unique().tolist())`**"
Expand Down

0 comments on commit 339fe7b

Please sign in to comment.