layout | title |
---|---|
page |
데이터 과학 -- 모형 |
"고대에는 '땅'이 가장 중요했고 땅이 소수에게 집중되자 인간은 귀족과 평민으로 구분됐으며, 근대에는 '기계'가 중요해지면서 기계가 소수에게 집중되자 인간은 자본가와 노동자 계급으로 구분됐다". 이제는 데이터가 또 한번 인류를 구분하는 기준이 될 것이다. 향후 데이터가 소수에게 집중되면 단순 계급에 그치는 게 아니라 데이터를 가진 종과 그렇지 못한 종으로 분류될 것이이다. 1
"AI is a superpower!!!", 인공지능을 체득하면 슈퍼파워를 손에 쥘 것이다.
금수저, 은수저 슈퍼파워를 받은 사람과 기계학습을 통달한 흑수저들간의 무한경쟁이 드뎌 시작되었다. 물론, 금수저를 입에 물고 기계학습을 통달한 사람이 가장 유리한 출발을 시작한 것도 사실이다.
"The future is here, it's just not evenly distributed yet."
- William Gibson
**모형-I**
-
모형 데이터 전처리 - Feature Engineering(피처 공학)
-
탐색적 데이터분석(EDA)
-
tidyverse
모형 -tidymodels
:tidyverse
성명서tidyverse
모형 헬로월드**caret
→parsnip
- 임직원 이탈 예측:
tidymodel
: 2020-07-20 tidymodels
: 나무모형, 나무모형 예측모형(CART, RF, ..., SGBM)- 포켓몬 PCA
- 펭귄 성별예측모형
- 펭귄 성별예측모형:
tidymodels
- 펭귄 성별예측모형:
tidymodels
- Hyper Parameter - 펭귄 성별예측모형:
tidymodels
+usemodels
- 펭귄 성별예측모형:
tidymodels
-XGBoost
tidymodels
- MDP / DALEX- 펭귄 성별예측모형:
tidyposterior
- 배포(Deployment)
-
GDPR
-
모형 시각화
-
모형 평가
-
모형 자동화(AutoML)
-
실무 모형
- 사기 탐지(Fraud Detection)
- 신용평점모형 개발
모형-II
-
Oldest but Goodies -
caret
-
Many Models
-
데이터베이스와 깔끔한 모형
-
모형 인프라(Model Infrastructure)
-
파이썬 실무 예측모형
-
데이터 결합(Data Fusion) - 네트워크, 텍스트, 이미지, 시계열