-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathWM_06.qmd
137 lines (77 loc) · 3.78 KB
/
WM_06.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
---
title: "Wissenschaftliche Methodik"
subtitle: "Sechster Termin"
format:
revealjs:
theme: fom-dls.scss
logo: DLS-Logo.png
footer: "WM | Karsten Lübke"
chalkboard: true
---
## Zur Erinnerung
📛 Schalten Sie bitte die Kamera an.
✏ Arbeiten Sie aktiv mit.
🤷 Stellen Sie Fragen.
💪 [https://tweedback.de/e1ry](https://tweedback.de/e1ry)
## Stimmung?
Auf der Skala von *Elon Musk*: Wie fühlen Sie sich heute?
![](img/Elon_Musk_eres_hoy_cut.jpg){fig-align="center" width="40%"}
::: aside
Quelle: [@Empoweringrace](https://www.pinterest.de/pin/1196337391792572/)
:::
## Verantwortung übernehmen!
::: {.columns}
:::: {.column width="50%"}
Arbeiten Sie die Vorlesung von Anfang an **vor** und nach. Nutzen Sie dafür die Studienbriefe.
::::: aside
Quelle: [sketchplanations](https://sketchplanations.com/the-accountability-ladder)
:::::
::::
:::: {.column width="50"}
![](img/sketchplanations-the-accountability-ladder.png){fig-align="center" }
::::
:::
## UN Ziel 6: Clean water and sanitation
::: center
<iframe src="https://upgrader.gapminder.org/q/6/embed?hasBorder=true&hasOpenSansFont=false" title="89% of people get this question wrong" width="100%" height="500" style="border:none;"></iframe>
:::
## Heutiges Thema 🏫
- Korrelation
- Einstieg in die lineare Regression
![](https://imgs.xkcd.com/comics/correlation.png){fig-align="center" width="70%"}
::: {.aside}
Abbildung: [https://xkcd.com/552](https://xkcd.com/552)
:::
## Was Sie lernen 👩‍🏫
- Sie können den Zusammenhang zwischen zwei metrischen Merkmalen visualisieren und interpretieren.
- Sie lernen die **[Lineare Regression]{.green}** kennen.
<br>
**Tipp**: Öffnen Sie:
- Übersicht: Lineare Regression
- R Befehlsübersicht
## Streudiagramm
::: {.center}
<iframe src="https://fomshinyapps.shinyapps.io/Korrelation/" width="475" height="535"></iframe>
:::
::: {.aside}
[https://fomshinyapps.shinyapps.io/Korrelation/](https://fomshinyapps.shinyapps.io/Korrelation/)
:::
## Korrelation (I/II)
- **Kovarianz** beschreibt den linearen Zusammenhang zweier metrischer Merkmale: $s_{xy}=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})$: Die Werte beider Variablen einer Beobachtung werden mit dem jeweiligen Mittelwert der Variable verglichen. Vom Produkt der gemeinsamen Abweichungen wird $\approx$ Mittelwert berechnet.
- Der **Korrelationskoeffizient** nach Pearson $r=\frac{s_{xy}}{sd_x \cdot sd_y}$ normiert die Kovarianz auf den Wertebereich $-1$ bis $+1$ durch Division der Kovarianz durch das Produkt der Standardabweichungen.
## Korrelation (II/II)
- Korrelationskoeffizienten $r>0$ zeigen einen positiven linearen Zusammenhang an, $r<0$ einen negativen. Je größer $|r|$, desto größer ist der lineare Zusammenhang.
- **Achtung**: Korrelation heißt nicht zwangsläufig Kausalität, keine
Korrelation heißt nicht zwangsläufig kein Zusammenhang oder keine Kausalität. Beispiele unter [http://www.tylervigen.com/spurious-correlations](http://www.tylervigen.com/spurious-correlations).
## Visualisierung
Erst visualisieren, dann korrelieren! $\bar{x}, \bar{y}, sd_x, sd_y,r_{x,y}$ sind nahezu konstant.
::: {.center}
<iframe src="https://damassets.autodesk.net/content/dam/autodesk/research/publications-assets/gifs/same-stats-different-graphs/DinoSequentialSmaller.gif" width="750" height="435"></iframe>
:::
::: {.aside}
[https://www.autodesk.com/research/publications/same-stats-different-graphs](https://www.autodesk.com/research/publications/same-stats-different-graphs/)
:::
## Fallstudie 💻
- Lokal: RStudio durch klick auf `WM_WiSe22.Rproj` starten oder RStudio aufrufen, das letzte Projekt müsste automatisch geladen werden.
- RStudio Cloud: In **Ihr** Projekt einloggen.
- `Lego-Fortsetzung.Rmd` im Ordner `fallstudien` öffnen.