Rule based Auto ML 과 Meta Learning based Auto ML 두가지를 구현해보는 프로젝트
Scikit learn에서 제공해준 Machine learning cheat sheet기반으로 구현하였습니다.
- Rule based Auto ML Pipeline
Meta Learning 기반으로 Auto ML을 구현하였습니다.
-
Meta Learning
- 목표 : 최적의 Model 선정
- Open ML의 수많은 dataset들의 meta feature 보유
- 새로운 데이터의 meta feature 계산하여 Open ML내 datasets들의 meta feature 비교(Cosine similarity 이용)
- 데이터에 맞는 최적의 model 5개 선정
-
Bayesian optimizer
- 목표 : Model 별 최적의 hyper-parameter 선정
- Surrogate Model : TPE 사용
- Meta Learning 단계에서 선별 된 5가지 Model 별 최적의 hyper-parameter 선정
Heart Disease Prediciton Classification(Dataset)
-
Rule based
- Accuracy : 0.85
- F1 score : 0.84
-
Meta Learning based
- Accuracy : 0.89
- F1 score : 0.88