Skip to content

yonsei-gsi-bigdata-2020-fall/Main

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

빅데이터 분석 프로그래밍

Course Description

정보통신기술의 발전으로 다양한 종류의 데이터를 대량으로 확보하는 것이 용이해졌다. 또한, 지속적인 컴퓨팅 성능과 알고리즘의 발전으로 인해, 이전의 전통적인 방법인 수학 및 통계적인 방식과 같은 명시적인 방식으로 해결하지 못했던 과제들을 딥러닝과 같은 기술로 해결할 수 있게 되었다. 본 강의는 데이터 분석의 기본부터 기계학습에 대해 소개하며, 더 나아가 대량의 데이터, 즉 빅 데이터의 상황에서 머신러닝 알고리즘을 적용하는 방식에 대해 배운다.

Why you should know this

데이터 과학자가 되기 위해서 또는 데이터 사이언스 관련 업무를 하기 위해서는 단순히 이론적인 지식만으로는 부족합니다. 다양한 상황에 맞게 데이터 확보 및 처리를 할 수 있는 프로그래밍 능력이 뒷받침돼야 하며, 데이터베이스 또는 네트워크에 대한 이해도 또한 중요합니다. 이번 수업을 통해 꼭 Practical 한 Skill 들을 많이 얻어가시기 바라겠습니다.

Prerequisites:

선수과목이 없지만, 프로그래밍 수업을 들어보셨던 분들에게는 조금 더 수월한 과목이 될 것입니다.

Learning Outcomes

학기말이 되면 여러분들은 다음과 같은 것들을 할 수 있게됩니다.

  1. 파이썬 프로그래밍
  2. 데이터베이스-웹서버 셋팅
  3. Scikit Learn을 이용한 머신러닝
  4. Hadoop과 Spark에 대한 이해
  5. AWS, Github, Shell 환경 활용

Schedule

Course Dates: 2020.09.04(금) – 2020.12.18(금) (16 weeks)

Class Times: 금요일 1-3교시(9시-12시) (14 class sessions)

Class Date Topic Detail Assignment FAQ
1 9월 4일 Git, Shell Lecture 1 Assignment 1 FAQ 1
2 9월 11일 Python Part I Lecture 2, Practice 2 Assignment 2 FAQ 2
3 9월 18일 Python Part II Lecture 3, Practice 3 Assignment 3
4 9월 25일 Data Lecture 4, Practice 3 Assignment 4 FAQ 4
- 10월 2일 - 추석연휴 -
- 10월 9일 - 한글날 -
5 10월 16일 Data Preprocessing Lecture 5, Practice 5 Assignment 5 FAQ 5
6 10월 23일 EDA Lecture 6, Practice 6 None
7 10월 30일 지도학습 Lecture 7, Practice 7 Assignment 7
8 11월 6일 비지도학습 Lecture 8, Practice 8 None
9 11월 13일 인공신경망 Lecture 9, Practice 9 None
10 11월 20일 이상탐지 Lecture 10, Practice 10 None
11 11월 27일 시계열 분석, RNN Lecture 11, Practice 11 None
12 12월 4일 Hadoop, Map Reduce, Spark Lecture 12,Practice 12 None
13 12월 11일 Elastic stack Lecture 13, Practice 13 None
14 12월 18일 프로젝트 발표 - -

Assignment Schedule

Assignment Date Assigned Due Date Tutorial Solution Point
Assignment 1 금, 9월 4일 목, 9월 10일 Video 1
Assignment 2 금, 9월 11일 목, 9월 17일 - Video 30
Assignment 3 금, 9월 18일 목, 9월 24일 Video Video 34
Assignment 4 금, 9월 25일 목, 10월 15일 10 (P/NP)
Assignment 5 금, 10월 16일 목, 10월 29일 38
Assignment 7 금, 10월 30일 목, 11월 26일 Video 50

Class Assignments

과제는 크게 두가지로 분류됩니다. 매주 제출해야하는 과제가 있고, 중간발표/기말발표가 있는 프로젝트가 있습니다.

Weekly Assignments

  • 매주 제출하는 과제는, 최대 1시간 정도 소요되는 수준으로 출제될 것이며, 과제 형태는 매주 다르게 나옵니다. 그에 따라 채점 방식 또한 그때그때 상이합니다.
  • 해당 주차에 대한 복습을 위한 목적이 강하므로, 너무 스트레스받지 마세요. 😄

Projects

  • 프로젝트는 최대 2인 1팀으로 구성합니다. 1인 1팀도 가능합니다.
  • 중간발표는 프로젝트 주제를 정하고, 어떠한 데이터를 사용하여 무엇을 왜 하겠다 형식으로 발표를 합니다. (최대 5분)
  • 중간발표는 채점용이 아닌, 과제에 적합성에 대해 피드백을 받는 과정입니다.
  • 기말 발표는 중간발표 이후, 진행과정과 결과에 대해서 발표합니다. (최대 10분)
  • Project 관련

Evaluation

  • 참여점수 (40%)
    • 매주 제출되는 과제 (10%)
    • 이론 동영상 강의 시청 Percentage (10%)
    • 출석 (20%)
      • 10시 20분 까지 - 출석
      • 11시 까지 - 지각
      • 11시 이후의 접속 - 결석
    • 슬랙을 활용한 참여도 (추가점수 최대 5%)
  • 프로젝트 점수 (60%)
    • (TBD)자세한 평가기준은 추후 공개

Tools

  • Slack - 모든 커뮤니케이션은 슬랙을 통해서 해주세요! (특별한 경우에만 이메일로)
  • Kahoot - 퀴즈때 사용할 서비스입니다.
  • Cohoot - 수업 중 코드 복/붙을 위한 서비스입니다.
  • Yscec - 성적 확인, 동영상강의 시청용입니다.

Resource

  • Python/프로그래밍 기초를 공부하시고 싶으신 분들은 Coursera의 다음 강의를 추천 드립니다.
    • Programming for Everybody (Getting Started with Python)
    • 연세대학교는 4월부터 세계 최대 글로벌 MOOC(온라인 공개강좌) 플랫폼인 Coursera와 ‘Coursera for Campus Coronavirus Initiative(C4CV)’ 협약을 체결하여 우리 대학뿐만 아니라 예일대, 듀크대, 존스 홉킨스대, 홍콩과기대, 구글, IBM 등의 글로벌 대학/기업에서 제공하는 3,800여개의 우수 강좌와 400여개의 전문 과정을 무료로 수강할 수 있는 기회를 제공하고 있습니다. 관련링크
  • How to Think Like a Computer Scientist

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published