-
Notifications
You must be signed in to change notification settings - Fork 0
/
MSR_Kolokwium_1_qazwsx.txt
52 lines (31 loc) · 1.47 KB
/
MSR_Kolokwium_1_qazwsx.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
Zastosowanie pakietu R w statystyce medycznej
KOLOKWIUM
Podczas zajęć będzie wykorzystywany zbiór danych |Sacramento| z
biblioteki |caret|. Zbiór _należy_ pobrać bezpośrednio ze strony
http://www.if.pw.edu.pl/~paluch/MSR/data/sacramento_caret.txt. Zadanie
polega na wykonaniu analizy zbioru obejmującej:
1.
*(2 pkt.)* Sprawdzenie czy w zbiorze występują brakujące obserwacje
i ile ich jest. Imputację sztucznych pomiarów w miejsce brakujących.
2.
*(1 pkt.)* Stworzenie ramki danych zawierającej średnią i odchylenie
standardowe dla każdej kolumny liczbowej w zbiorze.
3.
*(2 pkt.)* Wykonanie rysunków pudełkowych dla zmiennych |beds|,
|baths|, |price|, |sqft| pogrupowanych ze względu na zmienną |type|.
4.
*(2 pkt.)* Wykonanie histogramu dla każdej zmiennej liczbowej z tabeli.
5.
*(12 pkt)* Zbudowanie wieloczynnikowej regresji liniowej
przewidującej cenę mieszkania w oparciu o te dane.
1.
Należy określić (dowolną sensowną metodą), które zmienne
istotnie wpływają na cenę mieszkania.
2.
Wskazane jest obliczenie dokładności modelu przy pomocy
walidacji krzyżowej.
W nawiasach podano *maksymalną* liczbę punktów jaką można zdobyć za dane
zadanie. Dodatkowy *1 pkt.* można otrzymać za przejrzysty, optymalny kod
napisany zgodnie z zasadami języka R. Skończony skrypt (z wyczerpującymi
komentarzami) należy wysłać na adres robert.paluch@pw.edu.pl
<mailto:robert.paluch@pw.edu.pl> przed wyjściem z sali.