정보통신기술의 발전으로 다양한 종류의 데이터를 대량으로 확보하는 것이 용이해졌다. 또한, 지속적인 컴퓨팅 성능과 알고리즘의 발전으로 인해, 이전의 전통적인 방법인 수학 및 통계적인 방식과 같은 명시적인 방식으로 해결하지 못했던 과제들을 딥러닝과 같은 기술로 해결할 수 있게 되었다. 본 강의는 데이터 분석의 기본부터 기계학습에 대해 소개하며, 더 나아가 대량의 데이터, 즉 빅 데이터의 상황에서 머신러닝 알고리즘을 적용하는 방식에 대해 배운다.
데이터 과학자가 되기 위해서 또는 데이터 사이언스 관련 업무를 하기 위해서는 단순히 이론적인 지식만으로는 부족합니다. 다양한 상황에 맞게 데이터 확보 및 처리를 할 수 있는 프로그래밍 능력이 뒷받침돼야 하며, 데이터베이스 또는 네트워크에 대한 이해도 또한 중요합니다. 이번 수업을 통해 꼭 Practical 한 Skill 들을 많이 얻어가시기 바라겠습니다.
선수과목이 없지만, 프로그래밍 수업을 들어보셨던 분들에게는 조금 더 수월한 과목이 될 것입니다.
학기말이 되면 여러분들은 다음과 같은 것들을 할 수 있게됩니다.
- 파이썬 프로그래밍
- 데이터베이스-웹서버 셋팅
- Scikit Learn을 이용한 머신러닝
- Hadoop과 Spark에 대한 이해
- AWS, Github, Shell 환경 활용
Course Dates: 2020.09.04(금) – 2020.12.18(금) (16 weeks)
Class Times: 금요일 1-3교시(9시-12시) (14 class sessions)
Class | Date | Topic | Detail | Assignment | FAQ |
---|---|---|---|---|---|
1 | 9월 4일 | Git, Shell | Lecture 1 | Assignment 1 | FAQ 1 |
2 | 9월 11일 | Python Part I | Lecture 2, Practice 2 | Assignment 2 | FAQ 2 |
3 | 9월 18일 | Python Part II | Lecture 3, Practice 3 | Assignment 3 | |
4 | 9월 25일 | Data | Lecture 4, Practice 3 | Assignment 4 | FAQ 4 |
- | 10월 2일 | - | 추석연휴 | - | |
- | 10월 9일 | - | 한글날 | - | |
5 | 10월 16일 | Data Preprocessing | Lecture 5, Practice 5 | Assignment 5 | FAQ 5 |
6 | 10월 23일 | EDA | Lecture 6, Practice 6 | None | |
7 | 10월 30일 | 지도학습 | Lecture 7, Practice 7 | Assignment 7 | |
8 | 11월 6일 | 비지도학습 | Lecture 8, Practice 8 | None | |
9 | 11월 13일 | 인공신경망 | Lecture 9, Practice 9 | None | |
10 | 11월 20일 | 이상탐지 | Lecture 10, Practice 10 | None | |
11 | 11월 27일 | 시계열 분석, RNN | Lecture 11, Practice 11 | None | |
12 | 12월 4일 | Hadoop, Map Reduce, Spark | Lecture 12,Practice 12 | None | |
13 | 12월 11일 | Elastic stack | Lecture 13, Practice 13 | None | |
14 | 12월 18일 | 프로젝트 발표 | - | - |
Assignment | Date Assigned | Due Date | Tutorial | Solution | Point |
---|---|---|---|---|---|
Assignment 1 | 금, 9월 4일 | 목, 9월 10일 | Video | 1 | |
Assignment 2 | 금, 9월 11일 | 목, 9월 17일 | - | Video | 30 |
Assignment 3 | 금, 9월 18일 | 목, 9월 24일 | Video | Video | 34 |
Assignment 4 | 금, 9월 25일 | 목, 10월 15일 | 10 (P/NP) | ||
Assignment 5 | 금, 10월 16일 | 목, 10월 29일 | 38 | ||
Assignment 7 | 금, 10월 30일 | 목, 11월 26일 | Video | 50 |
과제는 크게 두가지로 분류됩니다. 매주 제출해야하는 과제가 있고, 중간발표/기말발표가 있는 프로젝트가 있습니다.
- 매주 제출하는 과제는, 최대 1시간 정도 소요되는 수준으로 출제될 것이며, 과제 형태는 매주 다르게 나옵니다. 그에 따라 채점 방식 또한 그때그때 상이합니다.
- 해당 주차에 대한 복습을 위한 목적이 강하므로, 너무 스트레스받지 마세요. 😄
- 프로젝트는 최대 2인 1팀으로 구성합니다. 1인 1팀도 가능합니다.
- 중간발표는 프로젝트 주제를 정하고, 어떠한 데이터를 사용하여 무엇을 왜 하겠다 형식으로 발표를 합니다. (최대 5분)
- 중간발표는 채점용이 아닌, 과제에 적합성에 대해 피드백을 받는 과정입니다.
- 기말 발표는 중간발표 이후, 진행과정과 결과에 대해서 발표합니다. (최대 10분)
- Project 관련
- 참여점수 (40%)
- 매주 제출되는 과제 (10%)
- 이론 동영상 강의 시청 Percentage (10%)
- 출석 (20%)
- 10시 20분 까지 - 출석
- 11시 까지 - 지각
- 11시 이후의 접속 - 결석
- 슬랙을 활용한 참여도 (추가점수 최대 5%)
- 프로젝트 점수 (60%)
- (TBD)자세한 평가기준은 추후 공개
- Slack - 모든 커뮤니케이션은 슬랙을 통해서 해주세요! (특별한 경우에만 이메일로)
- Kahoot - 퀴즈때 사용할 서비스입니다.
- Cohoot - 수업 중 코드 복/붙을 위한 서비스입니다.
- Yscec - 성적 확인, 동영상강의 시청용입니다.
- Python/프로그래밍 기초를 공부하시고 싶으신 분들은 Coursera의 다음 강의를 추천 드립니다.
- Programming for Everybody (Getting Started with Python)
- 연세대학교는 4월부터 세계 최대 글로벌 MOOC(온라인 공개강좌) 플랫폼인 Coursera와 ‘Coursera for Campus Coronavirus Initiative(C4CV)’ 협약을 체결하여 우리 대학뿐만 아니라 예일대, 듀크대, 존스 홉킨스대, 홍콩과기대, 구글, IBM 등의 글로벌 대학/기업에서 제공하는 3,800여개의 우수 강좌와 400여개의 전문 과정을 무료로 수강할 수 있는 기회를 제공하고 있습니다. 관련링크
- How to Think Like a Computer Scientist