-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathWMQD_07.qmd
150 lines (88 loc) · 4.34 KB
/
WMQD_07.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
---
title: "Wissenschaftliche Methoden - Quantitative Datenanalyse"
subtitle: "Siebter Termin"
format:
revealjs:
theme: fom.scss
logo: fom.jpg
footer: "WMQD | Karsten Lübke"
chalkboard: true
---
## Zur Erinnerung
📛 Stellen Sie bitte ein Namensschild auf.
🤷 Stellen Sie Fragen.
💪 [https://tweedback.de/ethj](https://tweedback.de/ethj)
<br> Hinweise zu den **Prüfungsleistungen** finden Sie in der **Projektgruppe** zur Vorlesung.
Die **Studienbriefe** strukturieren Ihre Vor- und Nacharbeit.
## Stimmung?
:::: {.columns}
::: {.column width="50%"}
::: center
**A**:
<iframe src="https://giphy.com/embed/l4pLXMFYQmTM2se7m" width="480" height="271" frameBorder="0" class="giphy-embed" allowFullScreen></iframe>
:::
::: aside
Quelle: [via GIPHY](https://giphy.com/gifs/abcnetwork-tired-the-middle-l4pLXMFYQmTM2se7m)
:::
:::
::: {.column width="50%"}
::: center
**B**:
<iframe src="https://giphy.com/embed/pttEsx1vDDhYs" width="480" height="271" frameBorder="0" class="giphy-embed" allowFullScreen></iframe>
:::
::: aside
Quelle: [via GIPHY](https://giphy.com/gifs/pttEsx1vDDhYs)
:::
:::
:::
## UN Ziel 7: Affordable and clean energy
::: center
<iframe src="https://upgrader.gapminder.org/q/59/embed?hasBorder=true&hasOpenSansFont=false" title="83% of people get this question wrong" width="100%" height="500" style="border:none;"></iframe>
:::
## Heutiges Thema 🏫
- Korrelation
- Einstieg in die lineare Regression
![](https://imgs.xkcd.com/comics/correlation.png){fig-align="center" width="70%"}
::: {.aside}
Abbildung: [https://xkcd.com/552](https://xkcd.com/552)
:::
## Was Sie lernen 👩‍🏫
- Sie können den Zusammenhang zwischen zwei metrischen Merkmalen visualisieren und interpretieren.
- Sie lernen den **[Korrelationskoeffizient]{.green}**, kennen.
<br>
**Tipp**: Öffnen Sie:
- Übersicht: Explorative Datenanalyse und Deskriptive Statistik
- R Befehlsübersicht
## Streudiagramm
::: {.center}
<iframe src="https://fomshinyapps.shinyapps.io/Korrelation/" width="475" height="535"></iframe>
:::
::: {.aside}
[https://fomshinyapps.shinyapps.io/Korrelation/](https://fomshinyapps.shinyapps.io/Korrelation/)
:::
## Korrelation (I/II)
- **Kovarianz** beschreibt den linearen Zusammenhang zweier metrischer Merkmale: $s_{xy}=\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})$: Die Werte beider Variablen einer Beobachtung werden mit dem jeweiligen Mittelwert der Variable verglichen. Vom Produkt der gemeinsamen Abweichungen wird $\approx$ Mittelwert berechnet.
- Der **Korrelationskoeffizient** nach Pearson $r=\frac{s_{xy}}{sd_x \cdot sd_y}$ normiert die Kovarianz auf den Wertebereich $-1$ bis $+1$ durch Division der Kovarianz durch das Produkt der Standardabweichungen.
## Korrelation (II/II)
- Korrelationskoeffizienten $r>0$ zeigen einen positiven linearen Zusammenhang an, $r<0$ einen negativen. Je größer $|r|$, desto größer ist der lineare Zusammenhang.
- **Achtung**: Korrelation heißt nicht zwangsläufig Kausalität, keine
Korrelation heißt nicht zwangsläufig kein Zusammenhang oder keine Kausalität. Beispiele unter [http://www.tylervigen.com/spurious-correlations](http://www.tylervigen.com/spurious-correlations).
## Visualisierung
Erst visualisieren, dann korrelieren! $\bar{x}, \bar{y}, sd_x, sd_y,r_{x,y}$ sind nahezu konstant.
::: {.center}
<iframe src="https://damassets.autodesk.net/content/dam/autodesk/research/publications-assets/gifs/same-stats-different-graphs/DinoSequentialSmaller.gif" width="750" height="435"></iframe>
:::
::: {.aside}
[https://www.autodesk.com/research/publications/same-stats-different-graphs](https://www.autodesk.com/research/publications/same-stats-different-graphs/)
:::
## Korrelation und Kausalität
::: center
<iframe src="https://www.causeweb.org/cause/resources/fun/songs/correlation-does-not-imply-causation" title="" width="100%" height="500" style="border:none;"></iframe>
:::
::: aside
Quelle: [https://www.causeweb.org/cause/resources/fun/songs/correlation-does-not-imply-causation](https://www.causeweb.org/cause/resources/fun/songs/correlation-does-not-imply-causation)
:::
## Fallstudie 💻
- Lokal: RStudio durch klick auf `WMQD_WiSe22.Rproj` starten oder RStudio aufrufen, das letzte Projekt müsste automatisch geladen werden.
- RStudio Cloud: In **Ihr** Projekt einloggen.
- `Lego.Rmd` im Ordner `fallstudien` öffnen.