generated from rstudio/bookdown-demo
-
Notifications
You must be signed in to change notification settings - Fork 0
/
datasets.Rmd
492 lines (342 loc) · 16.5 KB
/
datasets.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
---
output: html_document
editor_options:
chunk_output_type: console
---
# 데이터셋 / `datasets`
## Prestige - `carData > Prestige`
![](fig/dataset-prestiage-01.png)
![](fig/dataset-prestiage-02.png)
```{r dataset-prestige, eval = FALSE}
data(Prestige, package="carData")
```
![](fig/dataset-prestiage-03.png)
```{r dataset-prestige-help, eval = FALSE}
help("Prestige")
```
carData 패키지에 있는 Prestige 데이터셋을 `.csv`로 저장하여 내보낼 수 있다.
[다운로드](data/Prestige.csv)
참조: [활성 데이터셋 내보내기...](https://rcmdr.tistory.com/52)
## Moore - `carData > Moore`
![](fig/dataset-moore-01.png)
![](fig/dataset-moore-02.png)
```{r moore-dataset, eval = FALSE}
data(Moore, package="carData")
```
![](fig/dataset-moore-03.png)
```{r moore-help, eval = FALSE}
help("Moore")
```
상기 명령 실행을 통해서 `Moore` 데이터셋에 대한 상세 정보를 얻을 수 있다.
```{r moore, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "Moore", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## OBrienKaiser - `carData > OBrienKaiser`
`carData` 패키지에 있는 `OBrienKaiser` 데이터셋이다. `carData` 패키지는 `Rcmdr` 패키지가 호출될 때 자동으로 함께 호출되기 때문에 **R Commander**에서 `carData` 패키지에 포함된 데이터셋들을 자유롭게 호출할 수 있다.
[Read data set from an attached package...](https://rcmdr.kr/37)
OBrienKaiser 데이터셋은 R Commander에서 활성 데이터셋으로 이용할 수 있다. 그러나 '통계 > 요약 > 활성데이터셋' 기능은 사용할 수 없다. 다음과 같은 오류문을 Rgui 창에서 보게된다.
> Error in sprintf(gettextRcmdr("There are %d variables in the data set %s.\nDo you want to proceed?"), :
> '%d'는 유효하지 않은 포맷입니다; 문자형 객체들에는 포맷 %s를 사용해주세요
입력창에 str(OBrienKaiser) 함수를 입력하고 실행하여 OBrienKaiser 데이터셋의 구조를 살펴보자.
![](fig/dataset-obrien-01.png)
입력창에 `summary(OBrienKaiser)` 함수를 입력하고 실행하여 요약 정보를 살펴보자.
![](fig/dataset-obrien-02.png)
```{r obrien-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "OBrienKaiser", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## OBrienKaiserLong - `carData > OBrienKaiserLong`
`OBrienKaiserLong` 데이터셋은 `carData` 패키지에 포함되어 있다.
`carData` 패키지는 `Rcmdr` 패키지가 호출될 때 자동으로 함께 호출되기 때문에, `OBrienKaiserLong` 데이터셋을 R Commander에서 메뉴기능을 통해서 활성데이터셋으로 불러올 수 있다.
통계> 요약 > 활성 데이터셋 메뉴를 통하여 OBrienKaiserLong 데이터셋의 요약정보를 확인할 수 있다.
![Windows 사례](fig/dataset-obrienlong-01.png)
`summary()` 함수를 이용한 것을 알 수 있다.
![Windows 사례](fig/dataset-obrienlong-02.png)
`str()` 함수를 활용하여 입력창에 직접 `str(OBrienKaiserLong)`을 입력하고 실행하여, 출력창에 다음과 같이 `OBrienKaiserLong` 데이터셋의 구조적 정보도 확인할 수 있다.
![Windows 사례](fig/dataset-obrienlong-03.png)
R Commander 화면에서 <데이터셋 보기> 버튼을 누르면 다음과 같은 내부 구성을 볼 수 있다:
![Linux 사례 (Ubuntu 18.04)](fig/dataset-obrienlong-04.png)
```{r obrien-long, eval = FALSE}
head(OBrienKaiserLong, 1) # first subject
```
```{r obrien-help-long, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "OBrienKaiserLong", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## airquality - `datasets > airquality`
![Linux 사례 (MX 21)](fig/dataset-airquality-01.png)
R이 시작될 때, datasets 패키지가 자동으로 호출된다. 따라서 R Commander를 실행할 때, datasets 패키지는 첨부 패키지화되어 메뉴창을 통해서 내부 데이터셋을 찾고 불러올 수 있다.
메뉴창에서 순서대로 데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기... 를 선택하면 다음과 같은 창이 등장한다.
![Windows 사례](fig/dataset-airquality-02.png)
출력창을 보면, airquality라는 데이터셋에는 6개의 변수가 있고, 각 변수는 수치형 정보를 담고 있다.
![Windows 사례](fig/dataset-airquality-03.png)
Month 변수는 최소 5에서 최대 9로 값이 있는데, 정확히는 5월부터 9월까지일 것이다. 한달 한달을 뜻하는 월(month)은 5월이 9월보다 크다고 할 수 없고, 5월, 6월, 7월, 8월, 9월 등으로 개체화되어 분리된다. 다시 말하면, 요인형 변수가 되어야 한다는 뜻이다.
그럼 왜, airqualty 데이터셋의 Month 변수는 수치형으로 되어 있을까. 원자료를 R의 데이터셋으로 불러오는 과정에서 해당 변수의 요인화과정이 생략되었을 것이다.
```{r airquality-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("datasets", "airquality", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## Bfox - `carData > Bfox`
![Linux 사례 (MX 21)](fig/dataset-bfox-01.png)
![Linux 사례 (MX 21)](fig/dataset-bfox-02.png)
```{r dataset-bfox, eval = FALSE}
data(Bfox, package="carData")
```
Bfox 데이터셋이 활성화되었다면, 도움말 기능을 통하여 데이터셋의 정보를 확인할 수 있다.
![Linux 사례 (MX 21)](fig/dataset-bfox-03.png)
```{r Bfox-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "Bfox", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## sleep - `datasets > sleep`
![Linux 사례 (MX 21)](fig/dataset-sleep-01.png)
![Linux 사례 (MX 21)](fig/dataset-sleep-02.png)
```{r dataset-sleep, eval = FALSE}
data(sleep, package="datasets")
summary(sleep)
str(sleep)
```
데이터셋의 내부는 다음과 같다:
![Linux 사례 (MX 21)](fig/dataset-sleep-03.png)
```{r sleep-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("datasets", "sleep", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## DavisThin - `carData > DavisThin`
![Linux 사례 (MX 21)](fig/dataset-davis-01.png)
![Linux 사례 (MX 21)](fig/dataset-davis-02.png)
![Linux 사례 (MX 21)](fig/dataset-davis-03.png)
```{r dataset-davis, eval = FALSE}
help("DavisThin")
```
```{r DavisThin-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "DavisThin", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## USArrests - `datasets > USArrests`
![Linux 사례(MX 21)](fig/dataset-usarrest-01.png)
![Linux 사례(MX 21)](fig/dataset-usarrest-02.png)
```{r usarrest, eval = FALSE}
data(USArrests, package="datasets")
```
![Linux 사례(MX 21)](fig/dataset-usarrest-03.png)
R Commander 화면 상단에서 <데이터셋 보기> 버튼을 누르면 아래와 같은 내부 구성을 확인할 수 있다.
```{r usarrest-help-dataset, eval = FALSE}
help("USArrests")
```
```{r usarrest-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("datasets", "USArrests", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## birthwt - `MASS > birthwt`
![Linux 사례 (MX 21)](fig/dataset-birthwt-01.png)
```{r birthwt, eval = FALSE}
data(birthwt, package="MASS")
```
birthwt 데이터셋이 활성화된 후, <데이터셋 보기> 버튼을 누르면 아래와 같이 내부 구성을 볼 수 있다:
![Linux 사례 (MX 21)](fig/dataset-birthwt-02.png)
```{r birthwt-help-cmd, eval = FALSE}
help("birthwt")
```
![Linux 사례 (MX 21)](fig/dataset-birthwt-03.png)
```{r birthwt-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("MASS", "birthwt", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## Friendly - `carData > Friendly`
![Linux 사례 (MX 21)](fig/dataset-friendly-01.png)
```{r data-friendly, eval = FALSE}
data(Friendly, package="carData")
```
![Linux 사례 (MX 21)](fig/dataset-friendly-02.png)
```{r data-friendly-help, eval = FALSE}
help("Friendly")
```
```{r friendly-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "Friendly", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## Cowles - `carData > Cowles`
![Linux 사례 (MX 21)](fig/dataset-cowles-01.png)
```{r dataset-cowles, eval = FALSE}
data(Cowles, package="carData")
```
![Linux 사례 (MX 21)](fig/dataset-cowles-02.png)
```{r dataset-cowles-help, eval = FALSE}
help("Cowles")
```
```{r Cowles-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "Cowles", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## Adler - `carData > Adler`
![Linux 사례 (MX 21)](fig/dataset-adler-01.png)
데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기... 기능을 선택하면, 위와 같은 메뉴 창을 보게된다.
carData를 선택하여 두번 클릭하면, 오른쪽에 carData 패키지에 내장된 데이터셋 목록이 등장한다. Adler 데이터셋을 선택한다.
![Linux 사례 (MX 21)](fig/dataset-adler-02.png)
```{r adler, eval = FALSE}
data(Adler, package="carData") # Adler 데이터셋 활성화시키기
help("Adler", package="carData")# 도움말파일 열기
```
```{r adler-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("carData", "Adler", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```
## warpbreaks - `datasets > warpbreaks`
![Linux 사례 (MX 21)](fig/dataset-warpbreaks-01.png)
```{r warpbreaks, eval = FALSE}
data(warpbreaks, package="datasets") # 데이터셋 불러오기
help("warpbreaks") # 데이터셋 도움말 보기
summary(warpbreaks) # 데이터셋 통계 요약 보기
```
![Linux 사례 (MX 21)](fig/dataset-warpbreaks-02.png)
R Commander 화면 상단 우측에 있는 <데이터셋 보기> 버튼을 누른다. 아래와 같이 warpbreaks 데이터셋의 내부 구성을 볼 수 있다.
![Linux 사례 (MX 21)](fig/dataset-warpbreaks-03.png)
```{r warpbreaks-help, echo = FALSE, results = "asis"}
# R 패키지 도움말을 R 마크다운 문서에 삽입하는 방법
# https://stackoverflow.com/questions/26480559/r-markdown-file-include-help-information
static_help <- function(pkg, topic, out, links = tools::findHTMLlinks()) {
pkgRdDB = tools:::fetchRdDB(file.path(find.package(pkg), 'help', pkg))
force(links)
tools::Rd2HTML(pkgRdDB[[topic]], out, package = pkg,
Links = links, no_links = is.null(links))
}
tmp <- tempfile()
static_help("datasets", "warpbreaks", tmp)
out <- readLines(tmp)
headfoot <- grep("body", out)
cat(out[(headfoot[1] + 1):(headfoot[2] - 1)], sep = "\n")
```