- 팀명 : GoldenPass(골든패스)
- 팀원 : 김대영, 김태우, 서창원, 최종현, 한성일
- History
- 2018.07.04 구글 머신러닝 스터디 잼 입문반 스터디 결성
- 2018.07~08. 구글 머신러닝 스터디 잼 입문반 수료
- 2018.09. Coursera course로 DL 스터디
- 2018.10. 구글 머신러닝 스터디 잼 심화반 수료
- 2018.11~12. Kaggle, DL 관련 책으로 스터디
- 2018.01~02. HeLP-Challenge 참가 (2-2. 주제부분 3위/10팀)
- 2018.02~ Facebook Developer Circle: Seoul에서 지원 받아 Spark Plus에서 스터디 중!!
본 HeLP Challenge
는 서울아산병원이 주최하는 의료인공지능 개발 콘테스트다. 관련 링크
- 대회 목적 : 인공지능 개발자들이 서울 아산병원의 의료데이터에 접근하여 연구할 수 있는 플랫폼을 제공함으로써 세계적인 의료인공지능기술 개발에 기여하고자 함.
- 참가자격 : 의료인공지능기술개발에 관심이 있는 개인, 대학, 스타트업, 연구기관, 기업
- 콘테스트 내용
- 1-1 뇌종양 MRI에서 뇌종양 영역 분할
- 1-2 심장 CT에서 right&left ventricle chambers, left ventricle myocardium, and papillary muscle 분할
- 2-1 뇌경색발생과 MRI 촬영 사이의 시간 추정
- 2-2 병리조직 슬라이드에서 breast cancer metastasis 여부 판정
- 우리 팀이 참가한 주제는
2-2 병리조직 슬라이드에서 breast cancer metastasis 여부 판정
이다. Contest 2-2. Breast cancer classification on frozen pathology
주제와 관련된 description wiki- 기간 : 2019.01.21.월 ~ 2019.03.03.월 6주간 진행
-
사전조사 : breast_cancer_challenges_tu.xlsx의
S
sheet 참고 -
진행과정 : breast_cancer_challenges_tu.xlsx의
Sc
sheet 참고- 2018.12.31 ~ 2019.01.06 (1주차) : 사전조사 완료
- 2019.01.07 ~ 2019.01.13 (2주차) : Windows 환경에 Openslide package 설치, 관련 git 조사
- 2019.01.14 ~ 2019.01.20 (3주차) : 설명회 참가. (거의 아무것도 안함)
- 2019.01.21 ~ 2019.01.27 (4주차) : 대회 시작.
- Openslide Package 뜯어보기
- Data preprocessing
- Whole process coding
- Data analysis
- Docker 공부, Finished Image 생성
- 2019.01.28 ~ 2019.02.03 (5주차) : 대충 모델이 완성되어 거의 아무것도 안함..
- 2019.02.03 ~ 2019.02.10 (6주차) : 설날.
- 도커로 학습되는지 확인
- 도커환경에서 돌릴 때 발생한 문제점들 하나씩 해결 (image build, docker file structure, package download, data preprocessing, memory, file handle etc..)
- 2019.02.11 ~ 2019.02.17 (7주차) : 도커 학습 성공
- 02.10. 첫 도커 학습 성공, 4시간 학습, Phase 1 score : 0.86
- training set sample size, model (simple, unet, inception) 변경해가며 적용
- data aug 빼면서 30시간 학습 (성능저하)
- data aug 추가해보면서 학습시킴, 다양한 data aug 실험
- 30 시간 학습 --> score 0.93으로 증가. epoch,
- 2019.02.18 ~ 2019.02.24 (8주차) : Phase2 Open: 새로운 data set
- Phase 2 submit에 맞게 inference 수정(그 전까지 학습한 model 활용 불가하게 됨..)
- 02.19. Phase 2 첫 score 0.66
- Phase1 score와 Phase2 score의 차이가 큼. sampling , 학습방법 잘못됐다는거 인지
- 02.21. sampling method 수정
- 2019.02.25 ~ 2019.03.03 (9주차)
- 02.25~27. 학습속도가 너무 느려 image 저장하고 data 저장하는 방식으로 변경, 30시간 학습, 성능 저하..
- learning decay (keras call back 활용)
- 02.21에 변경한 모델로 60시간 정도 학습하는 걸로 마무리 (20000 samples 20 epochs) ( Phase 1 score 0.86 -> Phase 2 score 0.75)
- 03.03. ensemble 노가다. Phase2
0.76
마무리 (3위 / 10 팀)
-
도커 : 관련 설명
-
전처리
- openslide : openslideTest.ipynb, openslideTest_2.ipynb
- openslide windows 설치관련 : windows는
pip install openslide-python
으로 openslide 패키지가 다 깔리지 않는다. 실행시키기 위해서는Windows Binaries
를 별도로 받아서 설치해야하는데 다음링크의windows Binaries
를 다운받고 압축푼다음bin
안의libopenslide-0.dll
같은 파일들을 설정해둔 환경변수 경로에다가 복붙하거나,bin
파일경로를 환경변수에 추가하면 된다. - 전처리 : 관련 설명
-
학습
- 관련 설명 : 관련 설명
- 전반적인 프로세스 관련 코드 : description_whole_pr_0121.ipynb
- 네트워크
- simple : model_simple_1.ipynb
- unet : model_unet_1.ipynb
- inception : model_inception_1.ipynb
- data aug 확인사항 : data_augmentation_keras_test.ipynb
- 샘플링까지 제대로
- docker-simple-final
- docker-inception-3-4
- (속도 향상한다고 잘못 sampling 했었던 모델) docker-simple-3
- 관련 설명 : 관련 설명
Contest 2-2. Breast cancer classification on frozen pathology
: 3위 / 10 팀
(Phase 2로 시상)
-
김태우 : 참가 후기 글
-
최종현 : 처음에 대회 OT에 참여 했을 때, 대단하신 분들이 많아서 저희 팀끼리 농담으로 '꼴등만 하지 말자'라고 했던게 엊그제 같은데 벌써 대회가 끝났네요. HeLP Challenge를 진행하면서 많은 것들을 배울 수 있어서 좋았습니다
- 좋았던점 :
- 쉽게 접해 보지 못 했던 의료 데이터를 가지고 딥러닝 모델에 적용해 볼 수 있어서 좋았습니다.
- 결과 파일을 도커(docker) 이미지 파일로 제출해야 했기 때문에, 도커에 대한 지식을 쌓을 수 있었습니다.
- 스터디 팀원들과 함께 딥러닝을 공부했던 것들을 실제 데이터에 적용하여, 전처리 부터 모델링까지 전체 과정을 경험해 볼 수 있었습니다.
- 아쉬웠던 점 :
- '이것은 도커 대회인가 딥러닝 대회인가'라고 느낄 정도로 저에겐 도커 때문에 제약사항이 많았습니다.
- 도커로 이미지 파일을 올려야 했기 때문에, 실시간으로 학습(Training)이 잘 되고 있는지 확인하기 어려웠습니다.
- 도커로 이미지 파일을 올려야 했기 때문에, 학습 후 Inference 과정에서 에러가 나면 처음 부터 다시 학습시켜야 한다는 번거로움이 있었습니다.
- 좋았던점 :
-
김대영 : 조직 슬라이드라는 의료 데이터를 통한 딥러닝 모델을 만들어 볼 수 있는 값진 경험을 했습니다.
openslide
라이브러리를 통한 데이터 분석은 낯설어서 더 어렵게 느껴졌지만 확실히 신선하며 재미있었고,
저 역시 도커 때문에 많은 삽질을 경험하긴 했지만 덕분에 도커 관련 지식도 많이 알게 되어서 좋았습니다.
이번 대회를 하며 한 층 성장하게 된 것 같아서 기쁘고,
무엇보다도 대회기간 동안 애써주신 모든 팀원분들께도 감사 말씀드립니다!😍
마지막으로 케라스는 사랑입니다💖