-
Notifications
You must be signed in to change notification settings - Fork 1
/
gg_grouping.qmd
187 lines (156 loc) · 5.54 KB
/
gg_grouping.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
---
title: "chatGPT"
subtitle: "챗GPT 팀구성"
description: |
챗GPT를 데이터 과학 문제 해결에 동원해보자.
author:
- name: 이광춘
url: https://www.linkedin.com/in/kwangchunlee/
affiliation: 한국 R 사용자회
affiliation-url: https://github.com/bit2r
title-block-banner: true
#title-block-banner: "#562457"
format:
html:
css: css/quarto.css
theme: flatly
code-fold: true
code-overflow: wrap
toc: true
toc-depth: 3
toc-title: 목차
number-sections: true
highlight-style: github
self-contained: false
filters:
- lightbox
lightbox: auto
link-citations: true
knitr:
opts_chunk:
message: false
warning: false
collapse: false
editor_options:
chunk_output_type: console
editor:
markdown:
wrap: 72
---
# 데이터셋
챗GPT 교육에 참여한 설문조사 데이터를 정리한다.
```{r}
library(tidyverse)
library(readxl)
survey_26 <- read_excel("data/(붙임) 경기도청 챗GPT 직원직무 교육신청 명단(취합).xlsx", sheet = '4.26.(수)', skip =2) %>%
mutate(날짜 = "2023-04-26")
survey_27 <- read_excel("data/(붙임) 경기도청 챗GPT 직원직무 교육신청 명단(취합).xlsx", sheet = '4.27.(목)', skip =2) %>%
mutate(날짜 = "2023-04-27")
survey_28 <- read_excel("data/(붙임) 경기도청 챗GPT 직원직무 교육신청 명단(취합).xlsx", sheet = '4.28.(금)', skip =2) %>%
mutate(날짜 = "2023-04-28")
survey <- bind_rows(survey_26, survey_27) %>%
bind_rows(survey_28) %>%
janitor::clean_names(ascii = FALSE) %>%
set_names(c("연번", "실국", "소속", "직위", "성명", "프롬프트", "API", "성취목표", "날짜")) %>%
mutate(실국 = ifelse(is.na(실국), "직속", 실국))
```
# 데이터 가명처리
실국, 소속과 직위, 성명이 포함되어 있어 변수 중 성명을 가명처리한다.
이를 위해서 파이썬 `Faker` 패키지를 사용하여 가명으로 처리한다.
```{python}
from faker import Faker
import pandas as pd
import numpy as np
import random
from datetime import datetime
fake = Faker('ko_KR')
def create_rows_faker(num=1):
output = [{"name" : fake.name()} for x in range(num)]
return output
df_faker = pd.DataFrame(create_rows_faker(72))
```
가명처리 데이터를 정리한다.
```{r}
library(reticulate)
survey_tbl <- survey %>%
bind_cols(py$df_faker) %>%
select(-성명) %>%
rename(성명 = name) %>%
select(날짜, 실국, 성명, 직위, 프롬프트, API)
```
# 챗GPT
챗GPT `GPT-4`를 사용해서 챗GPT 실무교육을 통해 얻으려는 것을 요약하도록 프롬프트를 작성한다.
:::{.callout-note collpase="true"}
### 프롬프트: 챗GPT 교육참여 텍스트를 5개 목표로 군집화시켜 정리하시요
> 챗GPT 응답: <br>
> 1. 업무 효율성과 생산성 향상: <br>
> - 보고서 작성 및 엑셀 스킬 향상 <br>
> - 행정 업무의 간소화 <br>
> - 특정 직무 역할에서 ChatGPT를 적용하는 다양한 방법 탐구 <br>
> 1. 변화하는 기술 추세에 적응하고 새로운 기술 습득: <br>
> - AI와 ChatGPT의 최신 동향 이해 <br>
> - ChatGPT 사용에 뒤처지지 않기 위한 지식 획득 <br>
> - 변화하는 기술 풍경에 적응하기 위한 기본 지식 습득 <br>
> 1. 문제 해결 및 의사 결정 능력 향상: <br>
> - 기획 및 이벤트 프로모션을 위한 데이터 시각화 활용 <br>
> - 사례 연구 및 문제 해결을 위해 ChatGPT 사용 <br>
> - 지역 발전 및 IT 동향에 대한 ChatGPT의 영향 분석 및 이해 <br>
> 1. ChatGPT 응용 범위 확장: <br>
> - 일상 생활 및 다양한 산업 분야(예: 농업 홍보, 콘텐츠 산업)에 ChatGPT 적용 <br>
> - 다양한 비즈니스 프로젝트에서 ChatGPT 통합의 잠재력 조사 <br>
> 1. 의사소통 및 질문 기술 향상: <br>
> - 효과적인 프롬프트 질문 방법 학습 <br>
> - ChatGPT와 더 나은 상호 작용을 위한 기술 개발 <br>
> - 원하는 결과를 얻기 위해 올바른 질문을 하는 것의 중요성 이해 <br>
:::
# 통계 분석
설문조사에 나타난 자기평가 프롬프트 API 활용역량을 표로 요약한다.
```{r}
library(gt)
library(gtExtras)
survey_gt <- survey %>%
count(프롬프트, API) %>%
pivot_wider(names_from = API, values_from = n, values_fill = 0) %>%
mutate(라 = 0) %>%
gt::gt() %>%
tab_spanner(
label = "API 활용능력",
columns = c(
가,나,다,라
)
) %>%
gt_theme_nytimes() %>%
tab_header(title = "자기평가 프롬프트, API 활용역량") %>%
cols_align(
align = "center",
columns = everything()
)
survey_gt %>%
gtsave_extra(filename="images/gg_survey_gt.png")
```
![](images/gg_survey_gt.png)
요일별 초,중,고급 참여자 역량을 다음과 같이 요약한다.
```{r}
survey_gt_date <- survey %>%
mutate(수준 = case_when(프롬프트 %in% c("가", "나") & API %in% c("가", "나") ~ "초급",
프롬프트 == "라" ~ "고급",
TRUE ~ "중급")) %>%
count(날짜, 수준) %>%
pivot_wider(names_from = 수준, values_from = n, values_fill = 0) %>%
gt::gt() %>%
tab_spanner(
label = "자가평가 역량 종합",
columns = c(
초급, 중급, 고급
)
) %>%
gt_theme_nytimes() %>%
tab_header(title = "챗GPT 요일별 참여자 역량") %>%
cols_align(
align = "center",
columns = everything()
)
survey_gt_date %>%
gtsave_extra(filename="images/survey_gt_date.png")
```
![](images/survey_gt_date.png)