이 저장소는 앤드류 응(Andrew Ng.) 교수저 'Machine Learning Yearning'라는 책의 한국어 번역 내용을 포함한다.
번역 대상이 된 원서의 링크 는 현재 집필중인 Draft 버전으로, 업데이트가 될 때 마다 해당 링크와 동기화 될 예정 입니다.
3 이 책을 읽기전 미리 알아야 하는 것과 사용되는 표기법
6 개발/테스트 데이터셋은 같은 분포의 데이터로 구성되어야 한다
8 알고리즘 최적화를 위해서 단일-숫자 평가지표를 설정하는것
10 개발 데이터셋과 평가지표로 개발 사이클 순환 속도를 빠르게
11 개발/테스트 데이터셋과 평가지표를 언제 바꿔야 하는가?
12 요약: 개발 데이터셋과 테스트 데이터셋을 설정하는 것에 관하여
13 빨리 시스템을 만들어 보고, 개발 사이클의 순환을 빠르게 하자
14 에러 분석: 아이디어에 대한 평가를 위해 개발 데이터셋을 살펴보는 것
15 에러 분석 중간에 여러가지 아이디어를 동시에 판단해 보는 것
16 개발/테스트 데이터셋의 잘못 레이블링된 데이터를 정리하는 것
17 큰 사이즈의 개발 데이터셋이 있는 경우, 두개의 부분집합으로 이를 나누고, 그 중 하나만 관찰하는 것
18 "눈알"과 "블랙박스" 개발데이터셋은 얼마나 커야 할까?
36 다른 분포로 부터 구성되는 학습, 테스트 데이터셋을 언제 사용해야 하는가?
37 모든 데이터를 사용해야하는지 어떻게 결정을 내려야 하는가?
38 일관적이지 못한 데이터를 포함시키기 위한 결정을 어떻게 내려야 하는가?
40 학습 데이터셋에서 개발 데이터셋으로 일반화 하는 것
44 최적화 검증 테스트(The Optimization Verification test)
50 파이프라인의 컴포넌트를 선택하는 것: 데이터 수집의 가능성
51 파이프라인의 컴포넌트를 선택하는 것: 작업의 간결성
52 직접적으로 부유한(rich) 출력값을 학습하는 것
55 에러를 특정 컴포넌트의 잘못으로 분류하는 일반적인 방법